如何在Python中正确测试科学的数据文件处理软件?

时间:2019-06-13 07:35:14

标签: python testing

我在分子生物学实验室工作,我们在其中使用机器人系统实现了一定程度的实验室自动化。特别是,我们有一个测量机器人,可以生成包含生物学数据的纯文本文件。为了使实验室成员能够进一步处理和分析数据,我编写了一个Python应用程序,该程序将纯文本文件转换为更有用的表格格式并执行基本的统计分析。 我快要离开实验室了。我想清理代码,以便(或多或少)可以由将来使用它的科学家轻松维护和使用。这是一个烂摊子,因为我几年来凭着自己的知识和熟练程度成长。在重构和重写软件的某些部分时,我想确保所有内容仍能正常工作。我发现自动单元测试是这里最可靠的策略(而不是每次运行分析时都要手动检查)。

我发现这对于统计功能很容易,因为我可以简单地得出模拟数据并知道期望什么以及如何处理它。我现在的问题是:如何模拟以正确复制的高度特定格式的数百个文件?

到目前为止,我所做的只是从以前的运行中获取输入数据,这些运行我知道可以在当前版本上运行。然后,我将输出文件与上一个版本中的相应输出文件进行了比较。 作为一名自学成才的编码员,对我来说,这似乎是我在想念的东西。您会如何建议我测试我的程序?还是这种策略实际上是可以接受的?

0 个答案:

没有答案