关键词:
Ubuntu操作系统
LDA模型
缺陷分类
缺陷报告分析
摘要:
软件缺陷(Bug)是造成系统失效的主要原因之一,为了更好地开发软件与修复软件失效,需要对缺陷的分布等特征有更好的理解。Ubuntu是一款得到广泛应用的开源软件,也是Linux操作系统当前在全球最成功的发行版之一。利用缺陷报告来发掘软件缺陷特征,对缺陷进行合理分类并分析操作系统常见缺陷的分布规律及特点,对于基于Ubuntu的国产混源操作系统开发、测试及维护过程中的代码质量分析及提升具有重要参考价值。首先,获取Launchpad上32805份Ubuntu操作系统的缺陷报告。然后,采用主题模型分析Ubuntu上常见的缺陷,并结合操作系统的组成特点将其分为内核相关异常、桌面环境异常、网络相关异常、硬件驱动相关异常以及上层应用及开发环境相关异常。进一步,利用F1值对分类结果进行评估,结果表明缺陷分类具有较好的准确率。最后,通过分析缺陷报告统计结果得到Ubuntu操作系统的近期缺陷的一般分布规律和特点,同时通过缺陷报告的分类结果,得到了有助于进一步认知Ubuntu操作系统缺陷的相关发现和结论。