关于数据集
语境
自从我开始研究数据科学领域以来,我注意到有很多可用于 NLP、医学、图像和其他主题的数据集,但我找不到任何适用于软件测试领域的足够数据。几乎不可用的数据集是从某些代码或一些历史数据中提取的,这些数据也不公开提供分析。软件测试和数据科学领域,尤其是机器学习,具有很大的潜力。在进行测试用例优先级排序研究时,特别是在软件测试周期的初始阶段,软件行业的公司设定优先级的方式是,没有那种格式的黑盒数据集。
这就是我希望存在这种数据集的原因。所以我收集了必要的属性,根据它们的值排列它们并创建一个。
内容
这些数据收集于 [2021 年 1 月],来自当地一家行业的 MIS,该系统由一个软件团队开发,该团队负责公司整个软件包,包括他们的管理系统。
数据集为 .csv 格式,此数据集有 1314 行和 8 列。这八个属性的详细信息如下:
B_Req –> 业务需求
R_Prioirty –> 特定业务需求的需求优先级,并在 .txt 文件中说明。
权重 –> 我已为“R_Priority(需求优先级)”分配了权重,其标准在 Testing_MIS.txt 文件中说明。FP
–> 每个测试任务的功能点,在我们的例子中是针对每个需求的测试用例,涵盖特定的 FP
复杂性 –> 特定功能点或相关模块的复杂性(分配复杂性的描述在本节下面列出)*
时间 –> QA 团队负责人分配给特定测试任务的每个功能点的预计最长时间。
成本 –> 使用复杂度和时间计算每个功能点的成本,并使用功能点估算技术,使用以下公式计算成本:
成本 = “成本 = (复杂度 * 时间) * 每个任务或每个功能点设定的平均金额
。注意:在本例中,设定为每工时 7 美元。
复杂度的标准列在本版本附带的 .txt 文件中。
优先级 –> 测试团队为每个功能点分配的测试用例的优先级。
灵感
我收集这些数据的灵感来自于在使用机器学习进行测试用例优先级自动化研究时,缺乏能够显示测试用例优先级及其要求和估计指标的数据集来分析数据。
–> 该数据集可用于分析和应用分类或任何机器学习算法来确定测试用例的优先级。
–> 可用于根据优先级、成本和时间或复杂性和要求来减少、选择或自动化测试。
–> 可用于构建与软件测试相关的推荐系统问题,帮助软件测试团队根据估计和推荐来减轻他们的任务。
