第08期 - 斯坦福大学小黄鸭

这个项目每周更新机器学习、人工智能领域最新、最热门的论文**

1、哈佛大学 CS50 小黄鸭

网址：https://cs50.ai/

来自斯坦福大学的 CS50 小黄鸭，一个能够通过多个平台回答课程相关问题的聊天机器人。

CS50 小黄鸭的名字来源于小黄鸭调试法（一种调试代码的方法，耐心地向一只小黄鸭解释每一行程序的作用，以此来激发灵感与发现问题），它可以类似于 ChatGPT 聊天，也可以自动回复论坛上的学生提问，还可以作为 VSCode 插件辅助编程。

CS50 小黄鸭通过一个可视的爱心计数器来限制使用频率。每位学生初始有 10 颗爱心，每隔三分钟可以恢复一颗。每次与 CS50 小黄鸭互动都会消耗一颗爱心，这样可以防止滥用行为。

我试了一下，GitHub 账号登陆即可，支持中文，效果还行吧

2、大学考试问题的多模态数据集

🌐 Homepage | 🤗 Paper | 📖 arXiv | 🤗 Dataset | GitHub

中文 LLM 评估新基准：CMMMU 中国大规模多学科多模态理解基准，包含 12k 手动收集的多模态问题。

CMMMU 是大学考试问题的多模态数据集，可通过 @huggingface Hub 获取： • 🧠 12k 个手动收集的多模式问题 • 🌐 涵盖 30 个主题和 39 种图像类型 • 📈 学术问题理解中人工智能模型的基准

3、每周机器学习论文精选

网址：https://github.com/dair-ai/ML-Papers-of-the-Week

这个项目每周更新机器学习、人工智能领域最新、最热门的论文

附了论文摘要和直达链接

4、一张图片，个性化图像合成

代码：https://github.com/InstantID/InstantID

试玩：https://instantid.org/#playground

只使用一张图片，就可以提取人脸，用于个性化图像合成，并支持各种不同的风格

我玩了几下，感觉蛮有意思的，效果还算满意。获取到 GPU 资源后大概 30-40 秒生成一张

5、OpenAI 重大更新

详情查看：https://openai.com/blog/new-embedding-models-and-api-updates

OpenAI 迎来几个更新，要点如下：

1、推出 text-embedding-3-small 和 text-embedding-3-large 全新 Embedding 模型，前者体积小、效率高、价格低，后者性能强大

2、新版且价格下调 50% 的 GPT-3.5 Turbo

3、最新的 GPT-4 Turbo 预览版 gpt-4-0125-preview，传言修复了模型变笨的问题

4、免费、强大的内容审核模型 text-moderation-007

6、傅盛：我们对做大模型没有执念，对做好应用有执念

链接：https://mp.weixin.qq.com/s/TdP82TDFCWyEZ79FuQKhSw

傅盛在猎户星空百亿大模型发布会上的演讲。

傅盛认为，企业要想真正用好 AI，必须全流程、全数据化，实现“数字老板”。对做大模型没有执念，对做好应用有执念，通过 AI 应用把大模型的能力和企业实际业务相结合，从而提供决策支持，助力企业达到王者段位。

傅盛预测，到 2024 年，千亿大模型中过半都会凋零，而百亿大模型会百花盛开。超越 OpenAI 的机会，将来自大模型应用公司。

傅盛的猎户星空发布了 Orion-14B 系列 LLM 模型，模型页面的测试挺全面的，主要特点有：模型整体多语言能力强，比如日语和韩语。支持超过 200k 的上下文。量化版本模型大小缩小 70%，推理速度提升 30%，性能损失小于 1%。Orion-14B 系列一共包含了 7 个不同的模型：基座模型、对话模型、长上下文模型、RAG 模型、插件模型、两个量化模型。