Jason Pan

GitHub 每周热点(240714)

潘忠显 / 2024-07-14


本周的 GitHub Trending 新增400⭐️以上的只有9个项目,相比之前几次整理,要少一些。

令人眼前一亮的就只有 微软的GraphRAG 和 基于搜索和 LLM 的 Wiki 创作工具 Storm。其他的一些项目大都长期的综合性项目,偶尔就会上一下榜,比如:public APIs,Free programming books,Hello Algo 等等。

microsoft/graphrag

总 Star: 10.3k, 本周新增 Star: 4284

链接:https://github.com/microsoft/graphrag

项目介绍:基于模块化图的 RAG 系统

RAG (Retrieval-Augmented Generation, 检索增强生成)是一种根据用户查询搜索信息,并提供结果作为 AI 答案生成参考的技术。

RAG 是大多数基于 LLM 的工具的重要组成部分,而大多数 RAG 方法都使用向量相似度作为搜索技术。

目前广泛使用的 Baseline RAG,但是他有些缺点:1. 很难通过使用存在不同意见片段信息的资料,来提供一个的综合见解;2. Baseline RAG 很难处理需要汇总整个数据集的信息才能得出答案的查询。

graph-rag-graph

微软研究院的 GraphRAG(官方博客:https://www.microsoft.com/en-us/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/),就是为了解决 Baseline RAG 的以上缺点。使用 LLM 基于私有数据集(LLM 未经过训练且从未见过的数据)创建知识图谱,然后将该图谱与图机器学习一起使用,在查询时执行即时增强。其基于 LLM 生成的知识图谱,在对复杂信息进行文档分析时显著提高问答性能。

博客中,有针对性的通过一个数据集,直观地比较了Baseline 和 GraphRAG:

graph-rag-comparison

freeCodeCamp/freeCodeCamp

总 Star: 393k, 本周新增 Star: 1223

链接:https://github.com/freeCodeCamp/freeCodeCamp

项目介绍:freeCodeCamp.org 的开源代码库和课程,免费学习编码。

freeCodeCamp-banner

freeCodeCamp.org 是个慈善组织,接收捐赠。社区已经帮助超过 40,000 人找到了第一份开发人员工作。

有全栈 Web 开发、机器学习等课程,完全免费且可自行安排进度;也有数千个交互式编码挑战。

要获得每项认证,需要构建其 5 个必需项目并通过所有测试。我这里列一下他们支持的课程分类:

freeCodeCamp

sindresorhus/awesome

总 Star: 310k, 本周新增 Star: 1153

链接:https://github.com/sindresorhus/awesome

项目介绍:😎 一些各类有趣的、awesome 的项目列表

不是为了列的广泛,而是要真的 awesom 的项目。

After all, it’s a curation, not a collection.

比如这里的 平台(platform) 项:

awesome-platform

stanford-oval/storm

总 Star: 5842, 本周新增 Star: 828

链接:https://github.com/stanford-oval/storm

项目介绍:STORM 是一个基于 LLM 服务的知识管理系统,可研究某个主题并生成带有引文的完整报告。

STORM 能根据通过互联网检索+多角度提问,来综合某个主题的大纲,从头开始编写类似维基百科的文章。

storm-demo

STORM 将生成带引用的长篇文章分为两个步骤:

  1. 写作前阶段:系统进行基于互联网的调研,收集参考资料并生成提纲。
  2. 写作阶段:系统利用提纲和参考文献生成带有引文的全文文章

storm-workflow

我这里自己尝试去让他写一个计算机字符编码的历史的文章,看上去还不错哦:

storm-char-encoding

TeamNewPipe/NewPipe

总 Star: 29k, 本周新增 Star: 461

链接:https://github.com/TeamNewPipe/NewPipe

项目介绍:NewPipe是一款适用于 Android 设备的免费和开源媒体播放器。最著名的是它是一个非官方的 YouTube 客户端。

newpipe

NewPipe 的工作原理是从正在使用的服务的官方 API(例如 PeerTube)中获取所需的数据。如果官方 API 受到限制(例如 YouTube),或者是私有的,NewPipe 则会解析网站或使用内部 API。这意味着用户不需要任何服务的帐户(比如YouTube账号),即可使用 NewPipe。

因为只需解析网站来获取必要的信息,此软件可以在没有安装 Google 服务的设备上使用。

NewPipe 是一个 Copyleft 自由软件。Copyleft 是一种让程序或其它作品保持 Free 的通用方法,并要求对 Copyleft 程序的任何修改和扩展都保持自由。

ossu/computer-science

总 Star: 165k, 本周新增 Star: 435

链接:https://github.com/ossu/computer-science

项目介绍:🎓 自学计算机科学的途径

OSSU,开放源代码协会大学,通过免费资源帮助学习者掌握大学课程。

ossu

而 OSSU 计算机课程是使用在线资料进行计算机科学的完整教育,根据路线图完成后,获得相当于计算机科学学士学位。

它适合那些想要全面地掌握所有计算学科基本概念的人,得是有意愿并且有良好习惯的人,不然可能自己坚持不下来。

来看下课程组织:

以其中 计算机科学核心-编程核心内容 小节来看,其实这些就是组织了一下 Coursera 上的课程链接

ossu-cs

ossu-coursera

public-apis/public-apis

总 Star: 301k, 本周新增 Star: 3854

链接:https://github.com/public-apis/public-apis

项目介绍:免费 API 大全

EbookFoundation/free-programming-books

总 Star: 328k, 本周新增 Star: 1622

链接:https://github.com/EbookFoundation/free-programming-books

项目介绍:免费计算机编程书籍

krahets/hello-algo

总 Star: 82k, 本周新增 Star: 1599

链接:https://github.com/krahets/hello-algo

项目介绍:《Hello 算法》:动画图解、一键运行的数据结构与算法教程。

支持 Python, Java, C++, C, C#, JS, Go, Swift, Rust, Ruby, Kotlin, TS, Dart 代码。简体版和繁体版同步更新。