「机器学习」写给 Python 开发者的 10 条机器学习建议( 二 ) |Python|操作系统|CSDN|

本文插图
固定随机数种子
实验的可重复性是非常重要的，随机数种子是我们的敌人。要特别注重随机数种子的设置，否则会导致不同的训练 / 测试数据的分裂和神经网络中不同权重的初始化。这些最终会导致结果的不一致。
1def set_seed(args):2 random.seed(args.seed)3 np.random.seed(args.seed)4 torch.manual_seed(args.seed)5 if args.n_gpu > 0:6 torch.cuda.manual_seed_all(args.seed)
先加载少量数据如果你的数据量太大，并且你正在处理比如清理数据或建模等后续编码时，请使用 `nrows `来避免每次都加载大量数据。当你只想测试代码而不是想实际运行整个程序时，可以使用此方法。
非常适合在你本地电脑配置不足以处理那么大的数据量，但你喜欢用 Jupyter/VS code/Atom 开发的场景。
1f_train = pd.read_csv(‘train.csv’, nrows=1000)

本文插图
预测失败 (成熟开发人员的标志) 总是检查数据中的 NA（缺失值），因为这些数据可能会造成一些问题。即使你当前的数据没有，并不意味着它不会在未来的训练循环中出现。所以无论如何都要留意这个问题。
1print(len(df))2df.isna.sum3df.dropna4print(len(df))

本文插图
显示处理进度
在处理大数据时，如果能知道还需要多少时间可以处理完，能够了解当前的进度非常重要。
方案1：tqdm
1from tqdm import tqdm2import time34tqdm.pandas56df['col'] = df['col'].progress_apply(lambda x: x**2)78text = ""9for char in tqdm(["a", "b", "c", "d"]):10 time.sleep(0.25)11 text = text + char 方案2：fastprogress
1from fastprogress.fastprogress import master_bar, progress_bar2from time import sleep3mb = master_bar(range(10))4for i in mb:5 for j in progress_bar(range(100), parent=mb):6 sleep(0.01)7 mb.child.comment = f'second bar stat'8 mb.first_bar.comment = f'first bar stat'9 mb.write(f'Finished loop {i}.')
解决 Pandas 慢的问题如果你用过 pandas ，你就会知道有时候它的速度有多慢ーー尤其在团队合作时。与其绞尽脑汁去寻找加速解决方案，不如通过改变一行代码来使用 modin 。
1import modin.pandas as pd

本文插图
记录函数的执行时间
并不是所有的函数都生来平等。
即使全部代码都运行正常，也并不能意味着你写出了一手好代码。一些软错误实际上会使你的代码变慢，因此有必要找到它们。使用此装饰器记录函数的时间。
1import time23def timing(f):4 """Decorator for timing functions5 Usage:6 @timing7 def function(a):8 pass9 """101112 @wraps(f)13 def wrapper(*args, **kwargs):14 start = time.time15 result = f(*args, **kwargs)16 end = time.time17 print('function:%r took: %2.2f sec' % (f.__name__, end - start))18 return result19 return wrapp

本文插图

「机器学习」写给 Python 开发者的 10 条机器学习建议( 二 )

推荐阅读

想做一个1000人的太极活动，北京哪块有场地最好是室外的

爸爸，你真的很重要！三年级以后，孩子更愿意听爸爸的想法

「南部的部分」云南及时雨！大面积降雨覆盖全省！新一轮中雨大雨将分布云南如下

养生壶可以烧开水吗养生壶能当水壶烧水吗

北京十六区各区繁华地段有哪些

何有强|素颜穿黑色毛衣配蕾丝内搭，一转身成亮点，蒋勤勤“心机”好重

2020男孩取名字寓意好的名字 2022男孩子寓意好的名字

苹果手机iPhone 11 Max带壳渲染图：后置三摄静音开关有变

经常憋尿，对身体的影响有多大？

公告|【提前看】22日公告精选：复星集团减持青岛啤酒股份比例达5%；多喜爱子公司中标22亿阿里项目

周扬青|远离渣男小猪之后的周扬青事业做到国外，努力让自己更加优秀

lol资讯君|不然打不了比赛了，Doinb在线诉苦：峡谷之巅14号要上钻一

生肖|心理有阴暗面的四大生肖

韩娱没有圈|T-ara朴孝敏ins晒“身材和美貌”近况，大秀美背、S 曲线

卫星|马斯克：由于火箭摄像头丢了，我们取消SpaceX第15批星链卫星发射

人民日报客户端|江西：运用智慧水利成果发现险情1600余处

乘坐北京–扬州 Z29/Z30 次列车是怎样的体验？

浙报融媒体 “栽树工程”再发力！北京大学宁波海洋药物研究院落户梅山

我国应如何促进制造业高质量发展？需要文化力量的“柔性支撑”

蛋白粉能治胃病吗