吉林省健康数字研究会

科普中国

您当前的位置：首页 > 科普中国

什么是数字计量？

作者：小编　　时间：2023-09-28 13:33:36

实现单位统一、量值准确可靠是数字计量的目标，其核心是对数据和算法的计量，是对信息技术中二进制数字的形式、内容、结构、语义、二进制数字对主观或客观世界的反映——数据和算法，以及承载二进制的物理设备、系统性能中计量问题的研究。包括两个方面：一方面为计量数字化，是传统计量采用信息化手段实现网络化、自动化、远程化的计量工作，包括计量电子证书和数字证书、测量不确定度在线云评定、远程计量和在线计量、计量数字化图谱、计量软件测评、智慧计量机器人、人工智能计量师、计量数据可视化等15个领域；另一方面为数字的计量化，是数字世界中引出的计量工作，包括算法溯源、数字图像、音频和视频计量、网络点击量和转发量计量、数字资产等15个领域。

数据采集

数据采集阶段存在的数字计量问题数据是数字计量的基础，在数据采集中，采集到的事实或统计内容与客体本身会有较大的差异，这种差异体现在定义的缺陷上和采集的有限性上。例如关于长度的定义是建立在抽象概念点之上，然而抽象的点在现实生活中并不存在，因而在现实中也就无法测量抽象的点之间的距离。同样由于采集设备的物理有限性，一般不能无限采集在空间和时间上有延绵特性的客体或现象，常常采用离散的方式采集，这就必须遵循奈奎斯特采样定律，使获得的数据在一定程度上能够满足质量要求。人工采集的数据一般以非量化数据为主，例如人口信息统计、选举投票、各类调查问卷、主观评价等。这类采集数据质量往往与样本、人员水平、人员态度、方式紧密相关。为了获得良好的数据，一般人工采集方案采用专业和数理的方法进行评估。但是由于各专业的局限性，对于数据采集目的最终实现，应引入计量基标准建立的技术方法开展，比如采用测量不确定度的评定方法对方案本身进行定量评估。设备采集相对于人工采集而言，数据质量相对较高。但是就同一设备而言，存在随着时空改变而导致采集质量下降的情况，例如电能表在使用一段时间后就需要更换，或是在运行一段时间后才能达到精准；同时也存在不同设备在同一时空下采集质量不同的情况。设备一般分为三类：第一类设备为非量化数据采集设备，例如家用照相机、摄像机或者录音机等；第二类设备为非计量类量化数据采集设备，例如家用体重秤；第三类设备为计量设备，例如电能表、水表、燃气表等。在这三类中，计量设备采集的数据质量最高，这是因为计量设备依据法律法规进行周期性检定/校准，从而较为有效地保证了计量设备的稳定性、可靠性和量值的溯源性；在第二类中，设备采集的数据质量较计量设备略差，这是因为这类设备所采集的数据只具有参考性意义，一般不宜用于科学研究；在第一类中，设备采集的数据主要用于定性判断。随着对数据质量要求的不断提升，第二类和第一类设备数据采用数字计量理论进行全方位研究成为计量学研究的重要内容。

数据计算

数据的计算分为两个阶段：数据采集时的计算和数据采集后的计算。当数据采集时，一般是从连续的无限中提取有限可表示信息，这就会导致数据的损失。数据采样频率越高和数据表示的准确度越高，对客体或现象的刻画就越精准，通常用采样率、字长和测量不确定度来表述。为了获得较高的数据质量，一般都采用预处理的方式进行，比如在电子计价秤中为了获得稳定的零点数据，采用了去噪、零点漂移的算法进行补偿。由于这类算法对数据采集有很大影响，应该在投入使用前进行计量。在数据采集后，需要进行分析，计算机内所使用的加减乘除都是有限字长，因此还会带来数据上的损失，如两个变量的除法运算，当分母为0时，计算机会报错。为了避免这一问题，程序员往往会加一个自定义的微小量，在计算结果中引入不确定度。因此这类算法对数据分析有很大影响，也应该在投入前进行计量。随着深度学习等人工智能技术的发展，科学家和应用工程师采用各种算法从大数据中提取有用结论，但是算法结论的科学性、准确性和可靠性却需要采用技术手段进行评估，为此，需要开展算法溯源的数字计量研究。