跳转至

OMG!第三届 Open Measurement Gathering(OMG)的有问必答(AMA)活动总结

以下内容原文翻译来自以下文章,主语角色为 Open Measurement Gathering (OMG):

2025 年 6 月 25 日,Open Measurement Gathering(OMG)举办了一场公开活动,名为 “Open Measurement Gathering 有问必答会议”,参与者包括 Censored PlanetIODAOONIMeasurement Lab。这次活动是 OMG 小组分享项目更新、未来计划,以及收集网络自由社群问题和意见反馈的机会。每个参与小组做了30分钟的简报,随后进行问答环节。

这场公开的线上活动受到先前两次 OMG 会议(公开报告 12)的启发,在这些会议上,OMG 小组分享了他们在平台、工具、数据集的令人兴奋的更新,然后再与更广大的网络自由社群分享。在第三次 OMG 会议中,各小组决定公开分享最新的更新信息,以鼓励社群的反馈。

活动期间,OMG 小组直接收集了来自网络自由社群的反馈建议并回答了问题。在本文的结尾,您可以看到一些来自社群的重要问题以及我们的回答。您还可以观看每个环节的简报并聆听完整的问答内容。

OMG 有问必答活动特别针对倡议型组织、数字人权研究人员、反审查工具开发者、记者、律师、行动人士、政策制定者和资助者。在活动高峰期,我们有大约 60 位来自世界各地的参与者。OMG 小组非常感谢到场的人士,我们希望未来能主办更多联合活动!

完整的 OMG 有问必答播放列表

简报摘要

Censored Planet 的工作内容

幻灯片录像

Censored Planet 是密歇根大学的一个研究团队,专注于建立可扩展的系统和新颖的方法,以保护用户免受网络审查、监控和数字鸿沟的影响。我们的工作位于网络、安全与隐私以及网络测量的交叉点。我们采用数据驱动的方法来检测和防御强大的网络中介者和政府威胁者。我们的观测站每天进行远程测量,以监测超过200个国家中哪些域名被封锁,并收集长时间且符合伦理的数据。

🆕 最近和即将推出的功能

  • Censored Planet 分析流程 v2:我们发布了新的分析流程,这表示从 Google Cloud 的批次云端处理重大转变为自我托管的实时基础设施。先前,所有的全球测量数据皆以每日批次处理,这在数据收集和可用性之间引入了一个延迟。新的流程会在每次测量完成后立即处理结果,使我们能够实时掌握正在进行中的审查事件。这种架构不仅提升了性能,也通过去除对商业云服务的依赖,改善了可持续性和数据控制。因此,我们现在能够更好地支持实时研究和快速反应行动。
  • Censored Planet API:随着基础设施升级,我们推出了首个公共 API,可在 data.censoredplanet.org 访问。此 API 使用 GraphQL 构建,提供以下功能:

    • 一个用于互动式探索和查询数据集的图形界面。
    • 提供给研究人员和开发者使用的 /query 程序端点
    • 访问自 2018 年以来收集的每项测量数据,包括所有测试的协议、域名和国家。

这个 API 是我们使命中的一个重要里程碑,旨在使 Censored Planet 的数据公开、易于访问且可付诸行动。它使社群能够建立自定义的仪表板,执行时间序列分析,并自动化审查检测流程。

  • Censored Planet Dashboard v2:我们还推出了一款全新设计的自我托管仪表板,目前可在 dashboard.censoredplanet.org 使用。与我们之前的仪表板不同,新版本由内部全权维护,并为长期扩展和定制化而构建。早期版本为了减少云服务托管成本,只展示最近6个月的测量数据,而 Dashboard v2 现在提供自 2018 年至今的完整数据集。让用户能直接通过仪表板进行历史性、纵向的审查模式分析。新仪表板的首页显示了一个全球 3D 可视化互动地球仪,呈现过去 30 天各国干扰率。为了确保这些统计资料的精确性和公平性,特别是在测量覆盖较少的国家,我们应用了先验的贝叶斯推断。对每个国家,我们结合最近的测量数据和精心选择的先验,计算干预概率的后验分布。这种方法有助于避免在测量数据有限的国家过高或过低估计干扰率。贝叶斯模型通过结合统计不确定性来平滑估计值,让在测量充分的国家中获得高可信度的干扰率,并与在覆盖较少地区中所做的谨慎预测保持平衡。

这种统计公平性对于负责任地呈现全球审查模式相当重要,特别是在测量覆盖仍然有限的地区。

新的仪表板还有一个“探索”页面,让用户可以直接控制他们想分析的数据。仪表板的首页会引导用户进入“探索”页面,这让用户有机会以互动方式分析数据。用户可以选择特定的国家、设置时间范围(最多 6 个月)、选择感兴趣的协议,并选择最多 10 个要关注的域名。然后,仪表板会从我们的 GraphQL API 获取相关的汇总数据,并呈现一系列针对该选择产生的详细可视化图表。

探索页面的一个核心部分是一个表格,显示每个域名及其类别、测试的网络和子网络、进行的探针数量,以及意外率,也就是遇到某种形式干扰的探测百分比。为了提供时间上的背景,仪表板还包括一个结果时间线,这个时间线直观地展示了探测结果随时间的变化。在选定的时间范围内的每一天,用户可以看到有多少次测量正常成功、多少次被中断,以及所检测到的特定干扰类型的详细细节。

仪表板还提供了一个网络层级的视图,按 ASN 和子网分解探测结果,帮助揭露审查是否在不同供应商间一致或针对特定 ISP。最后,我们加入了一个旭日图,以可视化方式总结测量结果在各个结果中的比例分布。

  • 审查早期预警系统:我们正在建立一个新的预警系统,利用 Google 趋势数据检测新兴审查事件的早期征兆。通过分析大众对 VPN 和其他规避工具的搜索兴趣激增,系统可显示用户困扰和潜在访问中断的信号,这在传统报道渠道有限、受限或受威胁的国家尤为宝贵。该系统对每日搜索数据应用国家特定的异常检测算法,并为每个检测到的突波分配一个影响因子,量化大众对规避的需求强度和紧迫性。这种以影响力驱动的方法有助于优先考虑应集中精力和资源的地方。在对 76 个国家进行的多年评估(2011-2024)中,该系统确认了149宗审查事件,包括62起未被网络自由社群报道过的事件。这些事件大多在出现后24小时内即被检测到,这使得该工具非常适合实时监控和快速反应。我们计划在未来几个月内公开发布,包括 API 和互动式仪表板界面。
  • 启动自定义测量功能:我们正在开发一个新界面,将允许外部研究人员和数字人权组织使用我们的基础设施来请求自定义的审查测量。
  • 参考文献:
    • 我们最近的研究重点在于巩固审查检测和规避的技术基础。在我们的研究『CenPush: 抗封锁通讯与推送通知』中,我们探索了推送通知服务作为审查规避工具的韧性控制通道的潜力。通过利用其间接的服务器到用户端的通讯模式,以及封锁后所带来的高附带损害,推送通知提供了一个强健且可持续的通道,自动传送用户端设置配置的更新,例如用来替换被阻挡的新代理 IP 地址,而不需要用户介入。经过基于测量的分析,我们证实这些系统即便在 IP 层级封锁下,仍然具备强大的可用性和抗指纹能力。我们已将基于推送通知的控制通道整合到 Android 的 Tor 客户端 Orbot 中。
    • 在我们的 FOCI 2025 论文『自定义拥塞控制是否是规避工具的一个坏主意?』中,我们探讨了主动式的拥塞控制算法(例如用于 Hysteria 和 TCP-Brutal 的算法)如何在性能和可检测性之间进行权衡。虽然这些自定义 CCAs 设计来在跨境连接不稳定的情况下提供更好的性能,但它们与标准的 TCP/QUIC 行为明显不同,使其容易被审查者分类和检测。通过控制实验和两阶段的基于门槛的分类器,我们展示了这些协议即便在不同网络条件下仍可被可靠地指纹化。我们的研究结果强调了保持规避工具行为与标准化协议一致的重要性,以维持流量的不可辨识性并避免被检测。
    • 在我们的论文『跨层 RTT 在代理流量指纹识别中的鉴别力』中,我们介绍了一种技术,通过它可以根据中间盒子(Middlebox)引入的往返时间(RTT)开销来远程识别审查中间盒。通过从数以千计的观测点测量微小的 RTT 变化,我们展示了此方法如何在不透明或恶劣的网络环境中识别特定的审查设备及其行为。这种方法使我们可以推断中间盒干预的存在、类型和范围,而无需特权访问或国内基础设施,提供了一种在大规模远程分析审查的新视角。

文献原文名称

本段落所提及的文献原始标题如下:

  • 『CenPush: 抗封锁通讯与推送通知』:"CenPush: Blocking-Resistant Communication Using Push Notifications"
  • 『自定义拥塞控制是否是规避工具的一个坏主意?』:"Is Custom Congestion Control a Bad Idea for Circumvention Tools?"
  • 『跨层 RTT 在代理流量指纹识别中的鉴别力』:"The Discriminative Power of Cross-layer RTTs in Fingerprinting Proxy Traffic"

Measurement Lab (M-Lab) 的工作内容

幻灯片录像

M-Lab 测量互联网、保存数据,并使其网络普遍可访问且有用。

  • M-Lab 的平台由遍布全球超过 40 个国家的 500 多台服务器组成。
  • M-Lab 支持一套开源工具和实验,用于测量互联网速度和性能(NDT)、路由路径和应用层性能。
  • M-Lab 将测量结果以开放数据形式提供于 BigQuery 中。

🆕 最近和即将推出的功能

  • Giga / UNICEF 案例使用:Giga 利用 M-Lab 平台来监测全球学校的连接情况。Giga Meter 定期进行测试以监测互联网性能,自 2024 年起已在 27 个国家与超过 1 万所学校进行了超过 150 万次测量。所有数据都在Giga 地图中提供。
  • IP Route Survey(IPRS):由巴黎索邦大学的 Dioptra 研究组发布的一个新数据集,由 M-Lab 出版。该数据集包含从 10 个观测点至所有可路由IPv4 前缀的常规路由追踪测量。详细信息可在我们的博客文章中了解。
  • 主机管理部署:M-Lab 通过启用新类型的服务器来发展其平台,旨在从新的网络位置测量更多的互联网,分散平台服务器和成本,以及扩大地理覆盖范围。
  • 互联网质量观测表(IQB):M-Lab 设计了 IQB 框架,旨在重新定义超越「速度」的互联网质量。IQB 考虑互联网中的多个使用情境和多个数据集来描述互联网质量。详细信息可在我们的博客文章中了解。

OONI 的工作内容🐙

幻灯片录像

网络干扰开放观测站(OONI)是一个非营利组织,开发免费且开源的网络测量工具,任何人都可以使用这些工具来测量和检测各种形式的网络审查。OONI 即时发布来自全球的网络测量数据作为公开数据。

🆕 最近和即將推出的功能

🔄 开发中 / 未来计划

IODA 的工作内容

幻灯片录像

IODA 提供了一个公开仪表板,展示网络连接测量,用来监控网络基础设施的连接情况并检测网络中断。IODA 由乔治亚理工学院的网络智慧实验室负责托管。全球的用户通过 IODA 来追踪和监控网络连接。IODA 也为技术研究社群提供了一个有价值的开放数据来源,激励合作并促使研究人员在网络测量领域发表科学文献。

🆕 最近和即将推出的功能

  • 数据信号的更高细微度:IODA 发布了一项更新,提供更高的数据细微度。具体而言,ASN/ISP 信号现在被本地化到其所运营的国家或地区,提供更本地化的连接图示。在这次简报中,我们展示了乌克兰苏梅巴拿马博卡斯德尔托罗的范例。此更新特别有助于识别跨地区运营的 ASN/ISP 内的中断情况。更多详情请查看我们的博客文章
  • 主动探测、延迟和损失信号:新信号可检测主动探测中的探测/响应损失延迟峰值,以推断广义限速或性能下降。来自加沙的一个例子显示出与近期光纤网络电缆被切割相对应的探测/响应损失。这一新数据将于 2025 年 7 月发布。
  • 新手资源中心:包含教程、研究论文、词汇表和数据库。我们旨在使这些工具更易于理解和使用。未来将有更多内容添加。更多详情请查看我们的博客文章
  • 仪表板重新设计:基于用户反馈和以用户为中心的设计进行改进。重新设计后更易于访问先前隐藏在按钮后的可视化和信号。
  • 上游延迟/路由追踪分析:使用路由追踪数据来追踪路径变化和测量倒数第二或最后一跳的 ASN/ISP 的延迟。这对于识别上游网络很有帮助,范例显示在卢旺达 (MTN)委内瑞拉(选后动荡)。这仅在 IODA 的 ASN/ISP 层次中可用,将于 2025 年 7 月发布。

🔄 开发中 / 未来计划

  • 整合 Mozilla 遥测数据。
  • 正在编辑全球电力中断数据集。
  • 本地化支持(超越仅通过浏览器翻译)。
  • 半自动化系统用于记录中断(以提高人工验证的效率)。
  • 动画解说视频以阐明测量方法。

社群提出的重要问题

  • 问:是否有尝试测量互联网干扰更广泛在其他领域的影响(经济、社会、政治)?
    • 答:关于经济影响,我们推荐您参考布鲁金斯学会这项研究中实施的方法。虽然有兴趣在现有工作基础上进行扩展,但更深入的分析可能需要与其他领域的专家合作。

  • 问: AI 如何应用于互联网测量工作?
    • IODA: 乔治亚理工学院的网络智慧实验室正在利用 AI 来对网络进行分类(例如,识别政府或住宅的 ASN)。未来,在我们的仪表板上可能会使用 AI 代理,让用户能够直接查询和交互测量数据。我们也考虑过使用大型语言模型(LLMs)来帮助识别网络中断的潜在原因。
    • M-Lab: AI 的一个潜在用途是帮助非技术用户更好地访问和分析互联网测量数据。我们有兴趣与合作伙伴一起探索这一领域。

  • 问: 为了资金,有没有可能转为营利性组织以减少对特定政府支持的依赖?
    • 答: OMG 团体保持非营利地位非常重要,无论是作为更大实体的一部分还是独立运作,这是因为他们的工作性质是使数据公开、值得信赖且保有弹性,尤其适用于互联网自由社群。此外,一些开放的网络测量工具依赖其社群来收集数据,我们不希望用户社群担心数据会被商业化。然而,OMG 团体有其他选项可以寻求变现可能,例如数据分析服务。

捐款链接:


  • 问:预测互联网中断/审查事件是否可行?
    • CP:其实不太可行——提前预测中断或审查仍然无法实现。然而,Censored Planet 正在开发一个早期审查预警系统,利用 Google 趋势中 VPN 搜索词的激增来标记在事件发生一天内出现的审查,尽管它无法提前预测事件。
    • IODA:在我们最近的论文《Destination Unreachable》中,我们对比了关闭与中断事件,进行了一项纵向和跨学科的研究,并识别出政治和技术上的特征。这些发现可能用于提供中断早期指标,以示范关闭事件与自发性中断的特征。阅读更多关于该研究的内容请点击这里

  • 问:用户可以订阅更新吗?
    • 答:可以加入 Keep It On 和 OTF-Talk 邮件列表,获取网络自由社群的更新。要加入 OTF-Talk,请访问 https://www.opentech.fund/ 并滚动至网站底部进行请求。要加入 Keep It On,请通过电子邮件发送请求至 keepiton-request@lists.riseup.net
    • OONI:您可以订阅 ooni-talk 邮件列表,将收到 OONI 的最新更新。
    • M-Lab:加入我们的 Google 邮件群组讨论,可以访问 M-Lab 数据、接收更新,并参与 M-Lab 社群讨论。

  • 问:用户可以自定义网络中断或审查事件的警报吗?
    • 答:可以的。
    • IODA:IODA 有一个中断检测系统,会针对连接信号的异常下降发出警报。您可以在我们的用户资源中心了解更多关于此中断系统的信息。这些警报和中断摘要可在我们的仪表板上查看并可通过 API 访问

翻译说明

本篇文章的内容与信息量很多,一些用语可能会使用得不精准,如果您发现翻译上的错误,请不吝啬给予我们修正,感谢!