Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

1、总体宏观洞察 负责人 @HalloMelon,@Tenth-crew,@gloriaaa0312 #439

Open
Tracked by #438
will-ww opened this issue Dec 27, 2024 · 0 comments
Open
Tracked by #438

Comments

@will-ww
Copy link
Contributor

will-ww commented Dec 27, 2024

以下给出一些分析建议,供参考,希望结合已有的内容进行优化和扩展~

1. 总体宏观洞察

1.1 开源事件:全球开源生态的活跃度

1.1.1. 全球开源事件趋势:GitHub 全域分析

  • 分析目标:通过 GitHub 全域事件的年度变化,揭示全球开源生态的活跃度和趋势。
  • 分析维度
    • 2019-2024 年(近六年)事件总量的增长率对比。
    • 各类事件(Push、Pull Request、Issue、Watch 等)的分布及变化。
    • 年度活跃高峰期和低谷期的时间节点分析。
  • 优化点
    • 增加对不同事件类型增长贡献率的分解分析,找出事件类型的驱动力。
    • 探讨高峰期是否与特定的全球技术热点(如 AIGC、云原生)相关。

1.1.2. GitHub 与 Gitee 的总事件数趋势比较

  • 分析目标:对比 GitHub 和 Gitee 的事件量及其变化趋势,挖掘中国开源生态发展特点。
  • 分析维度
    • GitHub 和 Gitee 前 3 万活跃仓库的事件数量对比。
    • 两个平台事件类型分布的差异(如 Gitee 是否更聚焦于企业协作需求)。
    • 平台之间增速差异分析,揭示 Gitee 的增长潜力。
  • 优化点
    • 增加平台用户行为模式分析,展示两者在 Pull Request 和 Issue 等核心协作事件上的差异。
    • 探讨 Gitee 是否更能满足本地开发者需求(如更高的 PR 审查率)。

1.1.3. GitLink 平台事件分析

  • 该部分需要协调

1.2 活跃仓库:开源生态的核心参与者

1.2.1. GitHub 全域活跃仓库数目趋势

  • 分析目标:通过 GitHub 活跃仓库数量的变化,揭示全球开源生态的核心项目活跃度趋势。
  • 分析维度
    • 年度活跃仓库数量的增长趋势。
    • 活跃仓库的头部项目与长尾项目的分布(Pareto 法则)。
    • 仓库活跃度的均值与中位数变化,分析整体活跃水平的变化。
  • 优化点
    • 增加对“活跃仓库生命周期”的分析——长时间保持高活跃度的仓库与新兴仓库的比例变化。
    • 结合头部仓库的 OpenRank 值,评估其在全球生态中的主导地位。

1.2.2. GitHub 和 Gitee 活跃仓库活跃度趋势对比

  • 分析目标:对比 GitHub 和 Gitee 平台的活跃仓库活跃度,挖掘中国开源项目的成长轨迹。
  • 分析维度
    • 两个平台前 3 万活跃仓库的平均活跃度变化。
    • 不同类型的事件(PR、Issue 等)对活跃度的贡献对比。
    • 中国仓库是否呈现出更高的参与深度(如 PR 审查率和合并率)。
  • 优化点
    • 针对 Gitee,分析其头部项目是否开始在全球生态中占据更高影响力。
    • 增加对 Gitee 长尾项目的分析,探讨中小型开源项目的活跃度提升。

1.2.3. GitHub 和 Gitee 活跃仓库 OpenRank 趋势对比

  • 分析目标:通过 OpenRank 值的对比,揭示两大平台活跃仓库的影响力差异。
  • 分析维度
    • GitHub 和 Gitee 平台前 3 万仓库的 OpenRank 分布。
    • 中美仓库与中国本地仓库(Gitee)在 OpenRank 上的对比。
    • OpenRank 趋势分析:Gitee 是否在缩小与 GitHub 的差距。
  • 优化点
    • 结合 OpenRank 高分仓库的案例分析,展示中国头部项目的全球影响力(如 OpenHarmony、PaddlePaddle)。
    • 对比不同领域(如数据库、AI、大模型)的 OpenRank 表现,挖掘中国项目的技术优势。

1.3 活跃用户:开发者的全球化参与

1.3.1. GitHub 全域活跃用户数量趋势

  • 分析目标:揭示全球活跃开发者数量的增长趋势及其区域分布。
  • 分析维度
    • 全球活跃用户数量的年度增长率。
    • 开发者的行为分布:PR 提交者、Issue 评论者、代码审查者等角色。
    • 活跃用户的核心贡献比例:头部开发者是否贡献了绝大部分事件。
  • 优化点
    • 增加对开发者行为模式的分析(如中国开发者是否更倾向于代码贡献)。
    • 深入分析全球开发者的角色转化率(如从探索者到贡献者的转化过程)。

1.3.2. 活跃用户地理分布与排名

1.3.2.1 全球开发者地域分布
  • 分析目标:展示全球开发者的分布特征,重点关注中美印的开发者参与度。
  • 分析维度
    • 各国开发者的数量和占比。
    • 开发者活跃度对比(年度事件总量平均值)。
    • 中印等新兴经济体开发者的增长幅度。
  • 优化点
    • 增加对区域特征的探讨(如中国开发者在 AI、大模型领域的贡献特点)。
    • 主意:今年有了全球行政区划的细粒度标签数据,可以好好利用
1.3.2.2 中国开发者地域分布
  • 分析目标:挖掘中国开发者的地域分布特点,分析区域间的差异。
  • 分析维度
    • 北上广深与中西部地区开发者数量的占比。
    • 各地区开发者的活跃度和贡献类型。
    • 区域经济发展与开发者活跃度的关联性。
  • 优化点
    • 深化区域对比,探讨中西部是否在崛起(如成都、武汉的开发者增长趋势)。
    • 增加对高校开发者的分析,评估 OSPP 等项目的影响。

1.4 开源许可证:开源合法性与合规发展的演变

1.4.1. 使用开源许可证的仓库数量

  • 分析目标:统计全球和中国活跃仓库使用开源许可证的比例,评估合规意识的提升。
  • 分析维度
    • 使用许可证的仓库占比变化(全球 vs 中国)。
    • 许可证类型的分布(MIT、Apache、GPL 等)。
  • 优化点
    • 增加对不使用许可证仓库的风险评估,探讨合规的重要性。

1.4.2. 开源许可证种类变化趋势

  • 分析目标:分析开源许可证种类的多样性及其增长趋势。
  • 分析维度
    • 近五年新兴许可证(如木兰、CERN)的增长情况。
    • 中国本地许可证的使用率变化。
  • 优化点
    • 对比国内外许可证种类,探讨新兴许可证的推广效果。

1.4.3. 使用木兰系列许可证仓库数量变化趋势

  • 分析目标:评估木兰许可证的普及程度及其影响。
  • 分析维度
    • 使用木兰许可证的仓库数量及增长趋势。
    • 木兰许可证在特定领域(如政府项目、国企项目)的应用情况。
  • 优化点
    • 案例分析:展示木兰许可证在某些头部项目中的成功实践。

1.5 编程语言:技术趋势的反映

1.5.1. 2024 年开发者使用编程语言榜单

  • 分析目标:统计全球和中国开发者最常使用的编程语言。
  • 分析维度
    • 全球语言使用 Top10 排名。
    • 中国开发者使用语言的特点(如 Python 的增长)。
  • 优化点
    • 对比 GitHub 和 Gitee 的语言分布,探讨平台特性。

1.5.2. 2019-2023 年开发者使用编程语言趋势

  • 分析目标:分析全球和中国编程语言的长期变化趋势。
  • 分析维度
    • 近五年语言使用量的增长率(特别是 TypeScript、Rust)。
    • 新兴语言的崛起与传统语言的变化。
  • 优化点
    • 增加领域特定分析(如 AI 项目是否推动 Python 的使用)。
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant