CHAOSS 成立亚太地区共同体及探讨周期公布

想要知道开源世界发生的一切是否能够量化吗?或者说开源的艺术是否要在数字化转型中变成一门科学?最后只能考察人性了?这个可能是过于理想化的想法,但是谁说不可以了呢?至少现在业内的人们已经开启了开源世界的定性和定量分析,利用最先进的信息技术和开源共同体的社会手段来达成这一目标,来到了家门口,要不要参加?

Thu Apr 30, 2020 | 3100 Words | 大约需要阅读 7 分钟 | 作者: 姜宁,适兕 |


CHAOSS 是 The Community Health Analytics Open Source Software 的简写,翻译过来就是: 开源软件共同体健康度分析,因为共同体(Community)是开源的核心所在,没有共同体,就没有开源项目。

引言

去年开源之道的适兕,写了一篇文章:开源软件项目的定性和定量分析指标 ———— CHAOSS 指标解析,旨在介绍 CHAOSS 这个项目/共同体,当然也着重介绍了CHAOSS的阶段性成果:CHAOSS 在8月份发布的开源软件项目的量化指标。在刚刚过去的2020年4月份,也组织了一次播客聊天:开源项目的定量和定性分析—— 以CHAOSS 为例  ,对于CHAOSS项目的意义和进度是保持时刻关注的。

正文

就在昨天上午2020.4.29,12:52, 来自 CHAOSS 的重要成员(秘书长):Matt Germonprez 教授发了一封邮件,大体的内容如下:(读者想了解更多内容,请自行订阅: CHAOSS 邮件列表

大家好:

和大家同步一个消息,关于亚太地区 CHAOSS 共同体的在线会议信息。

周三,每两周一次,时间是:8am US Central // 1pm UTC // 9pm in Beijing - Singapore

下次会议时间:2020年5月6日

会议链接地址:https://unomaha.zoom.us/j/720431288

会议日程:

  1. 在亚太地区组织 CHAOSSCon
  2. CHAOSS 文档的翻译
  3. CHAOSS 软件和相关度量工作组

本次会议对所有感兴趣的人开放!感谢所有推动此事的同僚们!

适宜人群

  1. 开源 Community Manager
  2. 企业开源项目办公室(OSPO) 相关人
  3. 想了解开源发生内部机理的人
  4. 想投资基于开源项目的商业公司的VC
  5. 吐槽开源不可以量化的开放心态者
  6. 对软件工程度量关心的技术人员
  7. 想了解开源项目协作过程的过客

目前参与CHAOSS的开源大咖有哪些?

最新的一期的阶段性成果:Metrics ,在开篇即列出了参与人员:

Ahmed Zerouali, Akshita Gupta, Amanda Brindle, Alberto Martín, Alberto Pérez García-Plaza,Alexander Serebrenik, Alexandre Courouble, Alolita Sharma, Alvaro del Castillo, Ahmed Zerouali,Ana Jimenez Santamaria, Andre Klapper, Andrea Gallo, Andy Grunwald, Andy Leak, Aniruddha Karajgi, Anita Sarma, Ankit Lohani, Ankur Sonawane, Anna Buhman, Armstrong Foundjem, Atharva Sharma, Ben Lloyd Pearson, Benjamin Copeland, Bingwen Ma, Boris Baldassari, Bram Adams,Brian Proffitt, Camilo Velazquez Rodriguez, Carol Chen, Carter Landis, Chris Clark, Christian Cmehil-Warn, Damien Legay, Dani Gellis, Daniel German, Daniel Izquierdo Cortazar, David A.Wheeler, David Moreno, David Pose, Dawn Foster, Derek Howard, Don Marti, Drashti, Dylan Marcy, Eleni Constantinou, Emma Irwin, Fil Maj, Gabe Heim, Georg J.P. Link, Gil Yehuda, Harish Pillay, Harshal Mittal, Henri Yandell, Henrik Mitsch, Ildiko Vancsa, Jacob Green, Jaice Singer Du Mars, Jason Clark, Javier Luis Cánovas Izquierdo, Jeff McAffer, Jeremiah Foster, Jessica Wilkerson,Jesus M. Gonzalez-Barahona, Jocelyn Matthews, Johan, Johan Linåker, John Mertic, Jon Lawrence, Jonathan Lipps, Jono Bacon, Jordi Cabot, Jose Manrique Lopez de la Fuente, Joshua R.Simmons, Josianne Marsan, Kate Stewart, Keanu Nichols, Kevin Lumbard, Kristof Van Tomme, Lars, Laura Gaetano, Lawrence Hecht, Leslie Hawthorne, Luis Cañas-Díaz, Luis Villa, Lukasz Gryglicki, Mark Matyas, Martin Coulombe, Matthew Broberg, Matt Germonprez, Matt Snell, Michael Downey, Miguel Ángel Fernández, Mike Wu, Neil Chue Hong, Nick Vidal, Nicole Huesman, Nishchith K Shetty, Nithya Ruff, Parth Sharma, Patrick Masson, Peter Monks, Pranjal Aswani, Prodromos Polychroniadis, Quan Zhou, Ray Paik, Remy DeCausemaker, Robert Lincoln Truesdale III, Robert Sanchez, Rupa Dachere, Saloni Garg, Saleh Motaal, Samantha Logan, Santiago Dueñas, Sarvesh Mehta, Sarah Conway, Sean P. Goggins, Shane Curcuru, Sharan Foga, Shreyas, Stefano Zacchiroli, Thom DeCarlo, Tobie Langel, Tom Mens, UTpH, Valerio Cosentino, Venu VardhanReddy Tekula, Vicky Janicki, Victor Coisne, Vinod Ahuja, Vipul Gupta, Will Norris, Xavier Bol, Zibby Keaton

这个名单算得上开源社区名人的大集合,其中不乏在拥抱开源的巨头公司做事情的人。而且很多人都是写文章、演讲的布道好手,你总是能从中找出几位的。

有趣而实用的度量项(Metrics)

目前CHAOSS定义了170多个度量指标,有一些指标例如Github的 Issue,PR 都有具体的度量方法,而其他一些指标还只停留在概念讨论的问题。上图展示了这些度量指标的分类情况,CHAOSS将这些指标按照关注的主题分成了5个工作组来进行定义:

  • 公共指标Common Metrics

定义了在其他几个工作组都有能关心且又不能很明确的确定归属与哪个具体的工作组的指标。例如 组织的隶属关系, 响应率, 覆盖地域等。

  • 软件演进 Evolution

专注于开源项目的生命周期相关的,用来反映软件开发活动,代码开发效率,以及代码质量的指标。

  • 风险 Risk

重点关注与开源潜在风险有关的指标,其中包括了商业层面,代码质量,许可协议,以及安全方面的风险。

  • 价值 value

由于开源项目不能只依靠拥抱来活动投资, 这个工作组重点关注通过指标来描述开源项目的投资价值。

  • 多样性及包容性 Diversity and Inclusion

多样性及包容性是开源社区健康度核心指标, 这个工作组成立的目的是在开源代码项目中引入衡量多样性和包容性的经验,并在可能的情况下提供软件的支撑。

更多内容,还请详细阅读CHAOSS共同体的出品:Metrics。

数字化彻底的改变了所有的人文学科

​ ———— 赵生宇, 在读博士(开源数字化方向)

开源项目/共同体的核心度量—— Social Currency/Capital

读过著名分析北美文化社会的经典著作《阿尔比恩的种子——美国文化的源与流》 一书的读者肯定知道作者:大卫•哈克特•费舍尔 做了哪些工作:对北美的民俗各元素进行了详细考证,从宗教、地域、语言、建筑、群居模式等多个方面厘清了美国文化的源流,全面呈现了殖民时期美国的文化面貌,阐发了美国早期四种文化传统所内含的理念、互动融合的过程及其深远影响。

那么开源除了解决具体的技术问题之外,还能有什么因素影响到一个项目的成功和失败了呢?在金钱激励不是主要手段的情况下,如何让一个共同体正常运转?…..有太多无数的因素和作用力在开源的世界里了,此时,笔者就为大家分享一个CHAOSS Metrics非常重要的一个指标:Social Currency,一般翻译为:社会资本。

读过Jono Bacon 的著作《The Art of Community》的读者一定注意到了,作者引用的对于社会资本的定义,即来自著名社会学家罗伯特·帕特南:

社会资本指的是社会关系网络(即社会上个人之间的相互联系)和由此产生的互利互惠和互相信赖的规范。这种社会关系网络——无论对于个人还是对于集体、无论是否身处其中——都是有价值的。且这种价值在某种程度上是不可替代的。充分的社会资本有助于增进儿童福利、提高教育水平、提升经济表现、降低犯罪率、降低逃税情况、提高政府绩效、保证政府廉洁,且有助于增进公民身心健康、提升生活满意度。越来越多的研究显示,和周围的人在一起。

那么这样一个社会学概念,如何落实并数字化?可能很多人听了就摇头了,这个太难了。嗯,即使这样,CHAOSS 也没有气馁,因为这个对于开源共同体来说实在是太重要了。于是想出了很多手段,例如数据的收集办法:

  1. 收集沟通的内容:确定开源项目的共同体使用的主要沟通平台,设置从该平台到SCMS工具的数据管道,那么SCMS的关键数据就是共同体成员的产生的内容。

  2. 将沟通内容的评估标准化:使用 Codex 来定义重要的概念,在相应的共同体中如:“跟踪关键字”、“类别”等,通过统一的 Codex 可以确保一致的分析,因为不同的人对于共同体的情感(sentiment)是不一样的,而且必须定期的更新 Codex,使其日趋完善。

  3. 对沟通内容进行分析:在SCMS工具中,通过用 Codex 术语标记数据来分析社区情感(sentiment)。如果标记是由一组人员完成的,建议所有人定期聚在一起讨论趋势并确保一致的标记使用。如果标记是由人工智能算法完成的,那么人工团队应该根据需要对人工智能进行监督和再培训。

  4. 分享和可视化聚合的分析结果:将 Codex 属于随着时间而进行定量的计数可视化,例如,在仪表板中进行展示,所谓的仪表板就是将定性分析结果,生成一个容易观察趋势走向的指示板。要与团队成员一起分析。

  5. 设置基准、目标,并对未来的增长做预测:在获得了一定量的数据之后,就可以进行定基准了,然后对共同体进行相应的评估,以准确定位自身。它的优势和缺陷分别是什么?可以采取什么行动使共同体更加的健康、更加的有活力?进然形成具有明确目标的共同体计划。然后基于这些执行下去,从而获得下个周期的社会资本指标。

  6. 迭代上述过程:要在定期的评估会议上,讨论关于数据集或收集方法的优缺点。以在未来不断的优化方法。并且要将解决方案输入到系统并继续向前推进。

Truth is in the trend, power is in the pattern.

​ – CHAOSS Social Currency 工作组

目前的可视化结果如下所示:

如果你对开源有什么想法,欢迎参与我们的亚太区CHAOSS!Welcome!and feel free!

参考资料:

  1. 罗伯特·帕特南:何为社会资本?——从《让民主运转起来》到《独自打保龄》 http://www.ihss.pku.edu.cn/templates/learning/index.aspx?nodeid=131&page=ContentPage&contentid=1235
  2. CHAOSS 度量项综述 https://chaoss.community/metrics/
  3. 阿尔比恩的种子 https://book.douban.com/subject/27672664/
  4. Jono Bacon ,《the art of community》