第13期 - 王小川硬刚李彦宏

Claude 3 非常擅长 OCR 和结构化提取

目录
1、Google 成功攻破 ChatGPT
2、Open Al 开源 Transformer Debugger
3、Yi 模型的数据收集和训练过程
4、Comflowyspace : Al 图像与视频生成工具
5、Meta All in Al
6、支持多个平台使用的下载工具
7、Claude 3 非常擅长 OCR 和结构化提取
8、一译,看论文神器
9、Claude 3“最快、最实惠”的型号:Haiku
10、王小川硬刚李彦宏
11、更适合前端工程师的 Python 自学教程!
12、黄仁勋干货满满的两场最新对话

1、Google 成功攻破 ChatGPT

Google 发表了一篇论文,介绍了一种新型的模型窃取攻击方法 并表示他们已经成功攻破 ChatGPT

这种方法能够从像 OpenAI 的 ChatGPT 或 Google 的 PaLM-2 这样的黑箱模型中提取精确、重要信息。

仅需不到 20 美元,就能攻击并提取出 OpenAI 的 ada 和 babbage 语言模型的整个投影矩阵。

而且确认了这俩模型分别具有 1024 和 2048 的隐藏维度。

他们还恢复了 gpt-3.5-turbo 模型的确切隐藏维度大小,并估计恢复整个投影矩阵的成本不到 2000 美元。

主要特点:

1、目标和范围:攻击专门针对生产级别的语言模型,如 OpenAI 的 ChatGPT 或 Google 的 PaLM-2,这些模型通常作为黑箱服务通过 API 接口提供。攻击的主要目标是提取模型的嵌入投影层信息。

2、成本效益:该方法成本效率极高,能够以不到 20 美元的成本提取出 OpenAI 语言模型的投影矩阵,这一点通过实验确认。

3、揭示隐藏维度:通过这种攻击,研究人员首次确认了黑箱模型具有的隐藏维度大小(例如,1024 和 2048),这种维度信息对于理解模型的能力和结构至关重要。

4、高效率:该方法不仅成本低廉,而且高效,能够快速提取出模型的关键信息。例如,预计用不到 2000 美元就能恢复 gpt-3.5-turbo 模型的完整投影矩阵。

5、高精度:通过这种方法提取的模型信息(如投影矩阵)具有高精度,误差极小。例如,对于 OpenAI 模型,提取的嵌入层与实际模型之间的平均平方误差非常低(10^-4 级别),证明了攻击的精确性。

6、不同模型的适用性:攻击方法在多个不同的模型上进行了测试,包括不仅限于 OpenAl 的模型。这表明该攻击手段具有一定的普适性,可以应用于多种生产级语言模型。

7、安全和隐私影响:该研究揭示了即使是最尖端的语言模型,也存在被窃取关键信息的风险,这对模型的安全性和使用者的隐私提出了挑战,同时也提示需要更加重视模型的安全防护措施。

论文:https://arxiv.org/abs/2403.06634 PDF:https://arxiv.org/pdf/2403.06634.pdf

Stealing Part of a Production Language Model

2、Open AI 开源 Transformer Debugger

Open AI 最近开源了 Transformer Debugger,这 一个用于分析 Transformer 内部结构的工具。

这个系统融合了自动解释功能和稀疏自动编码技术(Sparse Autoencoders),使得用户在无需编写代码的情况下就能快速探索和理解各种模型。

它能够同时处理神经网络中的神经元和关注焦点(Attention Heads)。

使用这个系统,你可以在模型的前向传播过程中进行干预,比如移除某个特定的神经元,然后观察这样的操作会对结果产生怎样的影响。

简单来说,它提供了一种快速而简便的方法,让我们能够手动地去发现和理解神经网络中的“电路”——这里的“电路”是指神经网络中特定的功能组件和它们之间的联系。

项目地址:https://github.com/openai/transformer-debugger

3、Yi 模型的数据收集和训练过程

01.AI 团队发布论文,详细介绍 Yi 模型的数据收集和训练过程

🔹dBeaver:码农的开源数据库神器,插件想扩就扩! 🔹开源免费工具 LocalSend 引领文件共享新潮流 🔹每个程序员的数字宝典:关键操作时间一览与用户体验反馈

4、Comflowyspace:AI 图像与视频生成工具

开源跨平台的 AI 图像与视频生成工具 Comflowyspace,它提供比传统 SDWebUI 和 ComfyUI 更优质、更互动的体验。

地址:https://github.com/6174/comflowyspace

5, Meta All in AI

Meta 宣布他们正在开发两个拥有 2.4 万 GPU 的超级计算集群,并在 24 年底使综合计算能力接近 60 万个 H100 GPU。

这些超级计算集群将用于支持多种人工智能任务,包括培训 Llama 3 大型人工智能模型。

Meta 特别强调,他们致力于开放式计算和开源技术,这些集群基于 Grand Teton、OpenRack 和 PyTorch 等平台构建而成。

这些集群设计用于支撑大型和复杂的人工智能模型,着重于提升性能、确保可靠性和扩展能力。

Meta 的策略包括了设计定制化的硬件设备、采用先进的网络解决方案,比如 RDMA over converged Ethernet (RoCE) 和 NVIDIA Quantum2 InfiniBand 网络技术,还有利用 FUSE API 和 Tectonic 分布式存储等技术的优化存储方案。

此外,Meta 也在注重通过软件优化和与框架开发者(例如 PyTorch)合作,使其人工智能集群在最大化性能的同时,也易于使用。

来源:https://engineering.fb.com/2024/03/12/data-center-engineering/building-metas-genai-infrastructure/

6、支持多个平台使用的下载工具

一款开源的支持多个平台使用的下载工具 Gopeed,由 Golang + Flutter 开发的,轻量原生,支持(HTTP、BitTorrent、Magnet 等)协议下载,下载需求多的小伙伴可以试试看。 🤖 https://gopeed.com

7、Claude 3 非常擅长 OCR 和结构化提取 🔥

X 上有人测试了 Claude 3 的 OCR 能力

向其提供了关于 Prometheus 模型的复杂 Excalidraw 图表 - 包含小节以及交错的文本和图表 📑 🖼️。

Claude 3 能够提供每个部分的摘要,并确定图表的位置!

https://github.com/run-llama/llama_index/blob/main/docs/examples/multi_modal/anthropic_multi_modal.ipynb

8、一译,看论文神器

一译,看论文神器,上传论文,帮你翻译,并且可以左右两栏中英对照查看 网址:www.yiyibooks.cn

9、Claude 3“最快、最实惠”的型号:Haiku

网友测试 @AnthropicAI 声称的同类产品中“最快、最实惠”的型号:与 7B 型号和 GPT-3.5 相比,Claude 3 Haiku 确实占据了有吸引力的价格和速度位置。 其价格低于 GPT 3.5 Turbo,但高于开源 7B 产品。

对于那些寻求增量质量改进的人来说,这无疑是 GPT 3.5 Turbo 的一个有吸引力的替代品,并且值得考虑与 7B 型号相比。

10、王小川硬刚李彦宏

访谈全文:https://app.myzaker.com/news/article.php?pk=65f2659e8e9f093ad4151423

11、更适合前端工程师的 Python 自学教程!

这是一本向前端工程师教学 Python 的开源电子书,通过案例对比 JavaScript 和 Python 语言的异同,帮助前端工程师快速掌握 Python。

https://github.com/luckrnx09/python-guide-for-javascript-engineers

12、黄仁勋干货满满的两场最新对话

https://finance.sina.cn/chanjing/gsxw/2024-03-11/detail-inamxtkr1619017.d.html

3 月初,英伟达 CEO 黄仁勋回到母校美国斯坦福大学,参加了斯坦福商学院 SIEPR 经济峰会以及 View From The Top 系列活动。

两场公开的回放视频中,黄仁勋详细谈到英伟达的市场价值定位、AGI(通用人工智能)发展、AI 算力的增长,以及如何通过人类反馈将 AI 根植于人类价值观话题。