第22期 - 国产大模型再开源
李彦宏内部讲话:开源大模型不如闭源,后者会持续领先
大模型
GLM-4 开源:超越 Llama3
GLM-4-9B 开源模型综合能力相比 ChatGLM3-6B 提升 40% ,全面超过 Llama-3-8B-Instruct,中文学科能力提升 50%,最高支持达 1 百万 tokens 长文本,支持多达 26 种语言,函数调用(Function Call)能力媲美 GPT-4-Turbo。首次开源基于 GLM 基座的视觉模型 GLM-4V-9B,多模态能力比肩 GPT-4V。
模型下载:
Model | Type | Seq Length | Download | Online Demo |
---|---|---|---|---|
GLM-4-9B | Base | 8K | 🤗 Huggingface 🤖 ModelScope | / |
GLM-4-9B-Chat | Chat | 128K | 🤗 Huggingface 🤖 ModelScope | 🤖 ModelScope CPU 🤖 ModelScope vLLM |
GLM-4-9B-Chat-1M | Chat | 1M | 🤗 Huggingface 🤖 ModelScope | / |
GLM-4V-9B | Chat | 8K | 🤗 Huggingface 🤖 ModelScope | / |
阿里巴巴 Qwen2 开源
⭐ 5 种尺寸的基础和指导型号,包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。
📝 除英语和中文外,还接受过 27 种其他语言的数据培训。
🌟 在大量基准评估中表现 SOTA。编码和数学方面的表现显着提高。
🌠 Qwen2-7B-Instruct 和 Qwen2-72B-Instruct 的扩展上下文长度支持高达 128K 令牌。
🤗 DEMO: https://hf.co/spaces/Qwen/Qwen2-72B-Instruct 🤖 CODE: https://github.com/QwenLM/Qwen2
快手发布了可灵视频生成模型
可灵视频生成模型支持生成最长两分钟 30FPS 1080P 的视频。
生成质量是现在普通用户能接触到的天花板,5 秒视频这个等级完全超越了谷歌 Voe 视频模型。
运动幅度、不同比例、一致性、物理特性都是除了 Sora 之外现在看到最好的。
体验方法:快影 APP-AI 玩法-AI 视频生成中申请。
字节跳动开发 TTS 模型王炸级产品
Seed-TTS:由字节跳动开发的几乎完美接近人类的文本到语音(TTS)模型
该模型能够生成高质量、几乎无法与人类声音无法区分的语音。
无需训练的情况下,只需要简短的语音片段即可克隆生成高度自然且富有表现力的语音。
完全能否胜任读小说、配音等任务
Seed-TTS 还提供了对各种语音属性的高级控制能力,包括但不限于情感、语调、说话风格等。
还可以通过编辑文本来编辑生成的语音。
工具库
基于 Cloudflare 全家桶的博客方案
⚡️Rin 一个基于 Cloudflare Pages + Workers + D1 + R2 全家桶的博客,无需服务器无需备案,只需要一个解析到 Cloudflare 的域名即可部署。
缺点是非静态,不利于搜索引擎收录。演示:https://xeu.life
Chrome 浏览器内置大模型
Chrome 的网页平台团队正在探索一个“内置 AI”的概念,其中浏览器将内置 AI 模型,为浏览器功能和网页平台 API 提供设备上的 AI 支持。通过内置 AI,您的网站或网络应用程序将能够针对基础模型和专家模型运行各种 AI 任务,而无需担心部署和管理这些模型。特别是,我们将在大多数配备 Chrome 的现代台式机和笔记本电脑上本地运行 Gemini Nano,它是 Gemini 模型系列中最小的版本。
最新的 Chrome 已经内置大模型 (Gemini Nano) 了,官方推荐的用户是本地和远端大模型混合使用的方案。
使用 chrome 本地模型的好处: 1、本地处理敏感数据; 2、流畅的用户体验; 3、对 AI 的访问权限更高; 4、离线使用 AI。
Chrome 内置大模型并提供了一个翻译 API,支持多语言的翻译。
如果没有资格,可以提交申请
去除 PDF 加密最简单的方法
把 pdf 文件拖到任意浏览器里,选择打印,另存为 PDF,不需要安装任何辅助工具。
小爱音箱接入 ChatGPT
🏠 将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手。
🎓 LLM 回答。想象一下,你的小爱音箱变身聊天高手,可以使用 ChatGPT 等大模型来回答你的问题。 🎭 角色扮演。一秒调教小爱,无论是成为你的完美伴侣,还是那个能听你倾诉心事的贴心闺蜜,都不在话下。 💬 流式响应。爱情来得太快就像龙卷风,而你的小爱音箱也是,对你的爱意秒回,爱你不会让你等太久。 🧠 长短期记忆。小爱音箱现在能记住你们之间的每一次对话,越聊越默契,就像是你身边的老朋友。 🔊 自定义 TTS。厌倦了小爱同学的语音?帮你解锁「豆包」同款音色,就像真人在回你的消息。 🤖️ 智能家居 Agent。心情不好?小爱立刻懂你,自动帮你播放喜欢的音乐,调节灯光,逗你开心。
知识库
使用 Python 进行机器学习
- 描述各种类型的机器学习算法以及何时使用这些算法
- 比较和对比线性分类方法,包括多类预测、支持向量机和逻辑回归
- 编写 Python 代码,实现各种分类技术,包括 K-Nearest neighbors (KNN)、决策树和回归树
- 使用评估指标对数据集上的简单线性、非线性和多元回归结果进行评估
黄仁勋最新 2 万字演讲实录
以下为本次演讲的要点: ①黄仁勋展示了最新量产版 Blackwell 芯片,并称将在 2025 年推出 Blackwell Ultra AI 芯片,下一代 AI 平台命名为 Rubin,2027 年推 Rubin Ultra,更新节奏将是“一年一次”,打破“摩尔定律”。 ② 黄仁勋宣称英伟达推动了大语言模型诞生,其在 2012 年后改变了 GPU 架构,并将所有新技术集成在单台计算机上。 ③ 英伟达的加速计算技术帮助实现了 100 倍速率提升,而功耗仅增加到原来的 3 倍,成本为原来的 1.5 倍。 ④ 黄仁勋预计下一代 AI 需要理解物理世界。他给出的方法是让 AI 通过视频与合成数据学习,并让 AI 互相学习。 ⑤ 黄仁勋在 PPT 里甚至给 token 敲定了一个中文译名——词元。 ⑥ 黄仁勋表示,机器人时代已经到来,将来所有移动的物体都将实现自主运行。
轻阅读
人生很短,无论一个人多聪明,多有天分,也不可能漠视几千年来伟大学者共同努力得来的成果。这是人类了解大自然、了解人生、了解人际关系累积下来的经验,不是一朝一夕所能够成就的,所以一个人小的时候博览群书是非常重要的。 ——丘成桐
我为什么选择全家移居泰国清迈!泰国生活优缺点全方位分享! 这篇文章非常全面的介绍了泰国的医疗、教育、生活和事业。
世界上几乎所有美好的东西都要通过对抗熵增获得—— 想要成绩,就要把混乱的知识整理成体系; 想要财富,就要把复杂的工作梳理出标准; 想要幸福,就要把丰富的情感经营到恬淡… 成长的过程,就是不断剥离动物本能的过程。有的人脱胎换骨,成就最好的自己;有的人庸庸碌碌,浑浑噩噩过一生。