第20期 - GPT原理动画展示
冷知识:2024 年已过 40%
机器学习周刊:关注 Python、机器学习、深度学习、大模型等硬核技术
本期目录:
[TOC]
大模型
Google 发布生成式 AI 视频模型 Veo
Google 在 I/O 开发者大会上宣布了它的生成式 AI 视频模型 Veo,能以不同视觉和电影风格生成长度超过 1 分钟的 1080p 分辨率视频。
Google 称,Veo 具有自然语言的高级理解能力,能理解“延时拍摄(timelapse)”或“空中镜头(aerial shots of a landscape)”等电影术语,用户可用文本、图像或基于视频的提示导向他们想要的输出。
Veo 的视频输出更一致和连贯,能展现人和物的更真实运动。类似 OpenAI 的 Sora,Veo 将首先提供给电影制作人和内容创作者试用。
![[veo_example_014_jellyfish 1.mp4]]
Prompt: A lone cowboy rides his horse across an open plain at beautiful sunset, soft light, warm colors
一览主流 llm 性能、速度和价格的对比网站
分享一个可以一览主流 llm 性能、速度和价格的对比网站,方便大家选择适合自己的模型
性能最好:gpt-4o 速度最快:gemini 1.5 flash 价格最低:llama 3-8b,主要 deepseek 没做评测。
国内外 AI 大语言模型 API 价格对比
AIGCRank 大语言模型 API 价格对比是一个专门汇总和比较全球主要 AI 模型提供商的价格信息的工具。可以轻松查找和比较 OpenAI、Claude、Mixtral、Kimi、星火大模型、通义千问、文心一语、Llama 3、GPT-4、AWS 和 Google 等国内外主要 API 提供商的最新价格,确保找到最适合您项目的模型定价。
工具
开源的 AI 导航站模板
Tap4 AI Web UI 是一款开源的 AI 导航站模板,项目非常轻量级,维护简单,可一键部署到 Vercel!
功能
- 国际化
- SEO 友好(支持 i18n)
- 动态 sitemap.xml(支持 i18n)
- 快速发布
- 使用 NEXT 14 和 app 路由(react 服务器组件)
- Supabase serverless 数据库
这两年 AI 导航站的流量非常大,大家如果也想做 AI 导航站,不妨拿去白嫖吧!
2024 GitHub 加速器:开源 AI 11 个项目
GitHub 加速器宣布了 2024 年入选的 11 个开源 AI 项目,它们代表了全球开源 AI 领域的创新和加速发展。项目包括机器学习和 AI 框架、生物学和疾病发现、模型训练和微调工具、仿真、部署和全生产化系统、多模态和 3D AI 能力,以及从可穿戴设备到 AI 驱动机器人的新兴接口和设备。
11 个入选的开源 AI 项目:
-
Unsloth AI@UnslothAI 由 Daniel Han 和 Michael Han 创立,旨在使自定义 AI 模型更易访问。Unsloth 通过新兴技术和能力,使其比竞争对手快 2-5 倍,内存使用减少 70%,同时保持模型的性能和准确性。
-
Giskard@giskard_ai 由 Alex Combessie 和 Weixuan XIAO 创立,是一个用于测试和评估 LLMs 的开源库。Giskard 旨在提高开源 AI 模型的质量,推动整体采用、研究、透明度和问责性。
-
A-Frame@aframevr 由 Diego Marcos 共同创建和维护,是一个框架,旨在使任何人在网络浏览器中都能轻松开发 AR/VR 和 3D 内容。A-Frame 专注于集成 AI 工作流程,例如 3D 高斯溅射和生成性 AI,以创建图像和环境。
-
Nav2 由机器人专家 Steve Macenski 创立,是 Robot Operating System (ROS) 导航框架的先驱。Nav2 是全球部署最广泛的自主移动机器人(AMR)导航解决方案,被 100 多家公司信赖。
-
OpenWebUI@OpenWebUI 由 Tim Baek 创立,旨在为 AI 和 LLMs 构建最佳用户界面,为那些互联网访问受限的人提供利用 AI 技术的机会。OpenWebUI 通过 Web 界面本地运行 LLMs,使 AI 和 LLMs 更安全、更私密。
-
LLMware AI 由 Namee Oberst 创立,她与 CEO Darren Oberst 和 Stefan Bachhofner 一起,旨在为金融和法律机构构建安全和敏感的 LLM AI Agent 和 RAG 模型。
-
LangDrive 由 Michael Vandi 和 Spmatika 创立,他们在 CMU 攻读硕士学位期间构建了一个 LLM 电子邮件代理。LangDrive 是一个简单的框架,通过 API 和配置文件训练和部署生产级别的微调语言模型。
-
HackingBuddyGPT 由 Andreas Happe 和 Jurgen Cito 创立,旨在帮助道德黑客和安全专业人员利用 LLMs 使世界更安全。HackingBuddyGPT 是一个自主的黑客伙伴,具有人在环路中的基础设施。
-
Web-Check 由 Alicia Sykes 创立,她是一位开源倡导者,旨在通过基于任何网站或服务器的开放数据提供 AI 驱动的安全洞察,使互联网更安全。
-
Marimo@marimo_io 由 Akshay Agrawal 和 Myles Scolnick 共同创立,旨在解决数据科学和机器学习 Notebook 使用中的所有问题。Marimo 是一个下一代 Python Notebook,为 AI/ML 开发者提供可复现、可维护和可生产的 Notebook。
-
Talkd AI @talkd_ai 由 Vinicious Mesel 创立,他开始兼职开发 Talkd AI,以构建一个统一的 LLM 聊天 API,为多个 LLMs 和上下文提供抽象层。Talkd AI 旨在促进和传播 LLMs 中 RAG 技术的使用方法。