第13期 - 王小川硬刚李彦宏

Claude 3 非常擅长 OCR 和结构化提取

目录
1、Google 成功攻破 ChatGPT
2、Open Al 开源 Transformer Debugger
3、Yi 模型的数据收集和训练过程
4、Comflowyspace : Al 图像与视频生成工具
5、Meta All in Al
6、支持多个平台使用的下载工具
7、Claude 3 非常擅长 OCR 和结构化提取
8、一译，看论文神器
9、Claude 3“最快、最实惠”的型号:Haiku
10、王小川硬刚李彦宏
11、更适合前端工程师的 Python 自学教程！
12、黄仁勋干货满满的两场最新对话

1、Google 成功攻破 ChatGPT

Google 发表了一篇论文，介绍了一种新型的模型窃取攻击方法并表示他们已经成功攻破 ChatGPT

这种方法能够从像 OpenAI 的 ChatGPT 或 Google 的 PaLM-2 这样的黑箱模型中提取精确、重要信息。

仅需不到 20 美元，就能攻击并提取出 OpenAI 的 ada 和 babbage 语言模型的整个投影矩阵。

而且确认了这俩模型分别具有 1024 和 2048 的隐藏维度。

他们还恢复了 gpt-3.5-turbo 模型的确切隐藏维度大小，并估计恢复整个投影矩阵的成本不到 2000 美元。

主要特点：

1、目标和范围：攻击专门针对生产级别的语言模型，如 OpenAI 的 ChatGPT 或 Google 的 PaLM-2，这些模型通常作为黑箱服务通过 API 接口提供。攻击的主要目标是提取模型的嵌入投影层信息。

2、成本效益：该方法成本效率极高，能够以不到 20 美元的成本提取出 OpenAI 语言模型的投影矩阵，这一点通过实验确认。

3、揭示隐藏维度：通过这种攻击，研究人员首次确认了黑箱模型具有的隐藏维度大小（例如，1024 和 2048），这种维度信息对于理解模型的能力和结构至关重要。

4、高效率：该方法不仅成本低廉，而且高效，能够快速提取出模型的关键信息。例如，预计用不到 2000 美元就能恢复 gpt-3.5-turbo 模型的完整投影矩阵。

5、高精度：通过这种方法提取的模型信息（如投影矩阵）具有高精度，误差极小。例如，对于 OpenAI 模型，提取的嵌入层与实际模型之间的平均平方误差非常低（10^-4 级别），证明了攻击的精确性。

6、不同模型的适用性：攻击方法在多个不同的模型上进行了测试，包括不仅限于 OpenAl 的模型。这表明该攻击手段具有一定的普适性，可以应用于多种生产级语言模型。

7、安全和隐私影响：该研究揭示了即使是最尖端的语言模型，也存在被窃取关键信息的风险，这对模型的安全性和使用者的隐私提出了挑战，同时也提示需要更加重视模型的安全防护措施。

论文：https://arxiv.org/abs/2403.06634 PDF：https://arxiv.org/pdf/2403.06634.pdf

Stealing Part of a Production Language Model

2、Open AI 开源 Transformer Debugger

Open AI 最近开源了 Transformer Debugger，这一个用于分析 Transformer 内部结构的工具。

这个系统融合了自动解释功能和稀疏自动编码技术（Sparse Autoencoders），使得用户在无需编写代码的情况下就能快速探索和理解各种模型。

它能够同时处理神经网络中的神经元和关注焦点（Attention Heads）。

使用这个系统，你可以在模型的前向传播过程中进行干预，比如移除某个特定的神经元，然后观察这样的操作会对结果产生怎样的影响。

简单来说，它提供了一种快速而简便的方法，让我们能够手动地去发现和理解神经网络中的“电路”——这里的“电路”是指神经网络中特定的功能组件和它们之间的联系。

项目地址：https://github.com/openai/transformer-debugger

3、Yi 模型的数据收集和训练过程

01.AI 团队发布论文，详细介绍 Yi 模型的数据收集和训练过程

🔹dBeaver：码农的开源数据库神器，插件想扩就扩！ 🔹开源免费工具 LocalSend 引领文件共享新潮流 🔹每个程序员的数字宝典：关键操作时间一览与用户体验反馈

4、Comflowyspace：AI 图像与视频生成工具

开源跨平台的 AI 图像与视频生成工具 Comflowyspace，它提供比传统 SDWebUI 和 ComfyUI 更优质、更互动的体验。

地址：https://github.com/6174/comflowyspace

5, Meta All in AI

Meta 宣布他们正在开发两个拥有 2.4 万 GPU 的超级计算集群，并在 24 年底使综合计算能力接近 60 万个 H100 GPU。

这些超级计算集群将用于支持多种人工智能任务，包括培训 Llama 3 大型人工智能模型。

Meta 特别强调，他们致力于开放式计算和开源技术，这些集群基于 Grand Teton、OpenRack 和 PyTorch 等平台构建而成。

这些集群设计用于支撑大型和复杂的人工智能模型，着重于提升性能、确保可靠性和扩展能力。

Meta 的策略包括了设计定制化的硬件设备、采用先进的网络解决方案，比如 RDMA over converged Ethernet (RoCE) 和 NVIDIA Quantum2 InfiniBand 网络技术，还有利用 FUSE API 和 Tectonic 分布式存储等技术的优化存储方案。

此外，Meta 也在注重通过软件优化和与框架开发者（例如 PyTorch）合作，使其人工智能集群在最大化性能的同时，也易于使用。

来源：https://engineering.fb.com/2024/03/12/data-center-engineering/building-metas-genai-infrastructure/

6、支持多个平台使用的下载工具

一款开源的支持多个平台使用的下载工具 Gopeed，由 Golang + Flutter 开发的，轻量原生，支持（HTTP、BitTorrent、Magnet 等）协议下载，下载需求多的小伙伴可以试试看。 🤖 https://gopeed.com

7、Claude 3 非常擅长 OCR 和结构化提取 🔥

X 上有人测试了 Claude 3 的 OCR 能力

向其提供了关于 Prometheus 模型的复杂 Excalidraw 图表 - 包含小节以及交错的文本和图表 📑 🖼️。

Claude 3 能够提供每个部分的摘要，并确定图表的位置！

https://github.com/run-llama/llama_index/blob/main/docs/examples/multi_modal/anthropic_multi_modal.ipynb

8、一译，看论文神器

一译，看论文神器，上传论文，帮你翻译，并且可以左右两栏中英对照查看网址：www.yiyibooks.cn

9、Claude 3“最快、最实惠”的型号：Haiku

网友测试 @AnthropicAI 声称的同类产品中“最快、最实惠”的型号：与 7B 型号和 GPT-3.5 相比，Claude 3 Haiku 确实占据了有吸引力的价格和速度位置。其价格低于 GPT 3.5 Turbo，但高于开源 7B 产品。

对于那些寻求增量质量改进的人来说，这无疑是 GPT 3.5 Turbo 的一个有吸引力的替代品，并且值得考虑与 7B 型号相比。

10、王小川硬刚李彦宏

访谈全文：https://app.myzaker.com/news/article.php?pk=65f2659e8e9f093ad4151423

11、更适合前端工程师的 Python 自学教程！

这是一本向前端工程师教学 Python 的开源电子书，通过案例对比 JavaScript 和 Python 语言的异同，帮助前端工程师快速掌握 Python。

https://github.com/luckrnx09/python-guide-for-javascript-engineers

12、黄仁勋干货满满的两场最新对话

https://finance.sina.cn/chanjing/gsxw/2024-03-11/detail-inamxtkr1619017.d.html

3 月初，英伟达 CEO 黄仁勋回到母校美国斯坦福大学，参加了斯坦福商学院 SIEPR 经济峰会以及 View From The Top 系列活动。

两场公开的回放视频中，黄仁勋详细谈到英伟达的市场价值定位、AGI（通用人工智能）发展、AI 算力的增长，以及如何通过人类反馈将 AI 根植于人类价值观话题。

喜欢周刊 → 投喂一杯咖啡☕️

第13期 - 王小川硬刚李彦宏 X