慕测智能科技|易如反掌:深度学习的个案研究( 二 )
考虑到DE的低计算成本(10分钟与14小时) , DE是探索这种替代方案的明显和低成本的候选者 。 其次 , 为了其他研究人员能够重复、改进、反驳我们的结果 , 我们所有的脚本和数据都可以在Github上获得 。
2.1为什么探索更快的软件分析?
避免软件分析的缓慢方法是一个开放的和紧迫的问题:研究人员工业从业者现在经常广泛使用软件分析来发现 , 例如 , 将如何整合新的code[17] , 哪里最容易出现错误[54] , 谁应该修复错误[2] , 或者开发他们的代码需要多长时间[34 , 35 , 50] 。 像微软这样的大型组织通常采用数据驱动的策略开发 , 组织策略是从对从开发人员那里收集的大型数据集的广泛分析中学习而来的 , 但是方法越复杂 , 应用分析就越困难 。 Fisher等人 。 [20]将软件分析描述为一个工作流程 , 它将大量的低值数据提取到较少的高值数据集 。 由于SE分析的复杂性和计算成本 , 交互性、直接操作和快速系统响应的奢侈已经消失[20] 。 他们将现代基于云的分析描述为回到20世纪60年代的批量处理大型机上 , 在那里提交作业 , 分析师们等待结果 , 却对幕后的真实情况、需要多长时间或要花费多少几乎一无所知 。 Fisher等人记录16位工业数据科学家看到的问题 , 其中一个最关键的问题快速迭代 , 但需要稍微调整来提高调制解调器软件分析的质量使得这个问题更加严重 。 软件分析的新特征选择(featureselection)和特征发现(featurediscover-[28])技术不断发展 , 最新研究集中在深度学习方法上 。 这些都是令人兴奋的创新 , 有可能大大提高我们的软件分析工具的质量 。 但这些都是CPU/Gpu密集型方法 。 为了实例:离开控件学习者的设置可能需要几天到几周到几年的CPU时间[22 , 64 , 69],Lam等人 。 需要数周的CPU时间 , 才能将深度学习和文本挖掘结合起来 , 将错误报告中的错误文件本地化 。 花了240小时的GPU时间来训练一种基于深度学习的方法来生成给定自然环境下的API使用序列[24] 。 请注意 , 更快的CPU/GPU , 是无法解决上述问题的 。 我们不能再依靠摩尔定律[51]每18个月将计算能力提高一倍 。 云计算环境十分昂贵 , 因此培训模型的财务成本可能是令人望而却步的 , 特别是对于长期运行的任务 。
2.2什么是深度学习?
深度学习是机器学习的一个分支 , 它建立在多层神经网络上 , 对数据中的高层次抽象进行建模 。 根据LeCun等人的说法[4] , 深度学习方法是一种具有多层次表示的表示学习方法 , 它是通过组成简单但非线性的模块来获得的 , 每个模块将表示转换为更高、更抽象的级别上表示 。 与传统的机器学习算法相比 , 深度学习方法非常擅长绘制高维数据 。 通过利用广泛的计算能力 , 深度学习已经被证明是一种非常强大的方法 , 在许多领域[42] , 如计算机视觉和自然语言处理[4,37,47,60,63] 。 在2012年 , 卷积神经网络方法赢得了图像网络竞争[37] 。 因此 , CNN成为计算机视觉社区几乎所有识别和检测任务的主导方法 。 CNN被设计成以多个数组的形式处理数据 。 根据LeCun等人的说法 , CNN方法通常是一个由10到20层、数亿权重和数十亿个单元之间连接组成的巨大网络 。 与先进硬件和算法并行化 , 训练这样的模型需要几个小时[42] 。 对于处理序列数据的任务 , 如文本和语音 , 递归神经网络(RNNs)一直表现得很好 。 在上下文中 , RNN很擅长预测下一个字符或单词 。 例如 , Graves等人[23]建议使用长短期记忆(LSTM)RNN来执行语音识别 , 在基准测试数据上实现了17.7%的测试集误差 。 Sutskever等人[63]使用两个多层LSTMRNNs将英语句子翻译成法语 。
2.3在SE中的深度学习
我们研究深度学习 , 因为最近 , 它引起了研究人员[15,24,39,52,68,70,71,74,77]的关注 。 应用深度学习技术解决各种问题 , 包括缺陷预测、错误定位、克隆代码检测、恶意软件检测、API推荐 。 这项工作可以分为两类:
推荐阅读
- 三星公司发布2021款数字座舱 集成诸多高科技
- 刚有望“出人头地”就被三大科技巨头围剿,“挺川者”新阵地下线
- 小米11能检测心率:准确度堪比智能手表
- 谷歌建立新AI系统 可开发甜品配方
- 柔性电子市场广阔,领头羊柔宇科技获更多关注
- 曝LG也将推出卷轴屏手机 你怎么看?
- AI战疫、真5G来了,十大最热门科技应用演绎速度与温度
- 又爆炸!联电科技传来一声巨响,或把8 英寸晶圆市场"炸"了
- 联想发布智能眼镜 ThinkReality A3
- 烟台港“管道智脑系统”上线 在国内率先实现原油储运全息智能排产
