近年来,高通量和高内涵分析成为数字化实验室分析方法的大趋势,而这必然导致产生相较于以前几倍甚至几十倍的数据,但要知道大量的数据并非就是所谓的大数据。几乎每个行业都会产生大量的数据,且随着时间呈快速增长趋势。
大量的数据本身并非就是大数据:只有当这些数据能够按照一定的格式保存,并能有效的被查询、进行综合分析后可以获取某种新的相互关系,并从中得到更有用的信息时,这样的‘大量数据’才能被称之为大数据。
能够使人易于理解的大数据实际上都是经由实验得到的,犹如乱麻般的大量过程、结果数据。过去,虽然已经进行了测试,但得到的这些所谓的源数据却不能被有效的利用起来。此时,非常简单的大数据应用就能让您节约时间、金钱和资源。
要把积累的大量数据到变成大数据还有很多工作要做。许多实验室数据和信息都被存储在本地的数据库中,更多的是记录在纸张报告、记录表中,被分散在一个个文件夹中,这都使得它们不能用于大数据分析。
所以如何高效得对试验原始记录数据进行采集成为了制约发展的重要因素,目前有些实验室设备开放了接口可以和网萨实验室管理软件进行集成,从而自动化获取试验过程的数据。但是迄今为止,大多数实验室的原始记录还是被保存在纸质或者格式各异的电脑中。