2025年07月01——11日AI大事分享-青争开放社区

2025年07月01——11日AI大事分享

3058字 16分钟 2025-07-11 小青 298 0 该作者已发布841篇文章

2025年7月1日

01 大模型：谷歌Gemini 2.5 Pro API免费回归，百度开源文心4.5系列，华为则推出了720亿参数的盘古Pro MoE模型。
02 脑机接口：Neuralink的N1脑机接口取得显著进展，已帮助七名受试者通过意念控制设备，并计划在2028年实现全脑接口。
03 绘图：Koboldcpp通过支持Flux Kontext，为用户提供了比ComfyUI更简洁易用的修图体验。
04 金融：开源AI项目MIT的TradingAgents实现高回报，同时涌现出QuantLib、Kungfu和K-Quant等专业的量化交易与分析工具。
05 音频：Qwen团队发布了支持多语言及中文方言的文本转语音工具Qwen-TTS，目前通过API提供服务。
06 智能体：Kimi推出的深度研究Agent通过主动规划与多轮推理生成研究报告，在全球HLE考试中首次取得领先成绩。
07 案例：游戏化陪伴应用EVE、利用Gemini CLI高效整理笔记，以及结合大模型实现智能化的MySQL数据库运维。
08 编程：谷歌OpenEvolve能自动发现高性能算法，而Fusion AI则可将设计稿快速转为代码。
09 RAG：香港大学推出开源多模态RAG系统RAG-Anything，通过构建统一知识图谱处理包含文字、图像、表格等复杂文档。
10 报告：Iconiq Capital的《2025年AI现状报告》指出，AI正进入实战落地阶段，企业需关注成本控制与灵活产品策略，同时数据显示数据处理费用已超过训练成本。

2025年7月3日

1、开源端到端语音大模型Step-Audio-AQAA：听懂音频直接生成自然语音
2、百度发布“绘想”平台与MuseSteamer：AI生成视频，一张图即可搞定专业级大片！
3、浙大与阿里联合发布OmniAvatar:音频驱动全身数字人模型震撼登场
4、百度搜索迎来十年来最大改版:AI智能框、百看、AI助手全面进化
5、xAI控制台新增Grok4及Grok4Code引用，标志着下一代AI模型即将发布
6、Gemini Live重磅升级！无缝连接Google应用，智能生活触手可及
7、武汉首发全国首辆 AI 外卖配送车，配送效率大幅提升
8、Anthropic年化收入已达40亿美元，较年初增长近4倍、与 Cursor 竞争加剧

2025年7月4日

1、字节跳动EX-4D震撼开源：单目视频秒变自由视角4D大片
2、Bilibili开源动漫视频生成模型AniSora V3版，一键生成多种风格动漫视频镜头
3、DeepSWE 开源 AI Agent系统强势登顶，基于 Qwen3-32B
4、字节跳动开源新模型VINCIE-3B：3亿参数，支持上下文连续图像编辑
5、Stability AI开源Stable Audio Open Small，手机秒变音频创作神器
6、谷歌重磅发布Gemini for Education！免费AI工具席卷全球教育
7、Topview Avatar 2震撼发布！AI数字人革新电商带货，模特时代终结？
8、Perplexity推出Max订阅计划:每月200美元解锁无限AI生产力
9、Cursor 大胆挖人！Claude Code 核心人物转投竞争对手
10、OpenAI 声明：Robinhood 推出的 “OpenAI 代币” 与我们无关

2025年7月7日

1、腾讯元宝再升级:一句话搜索，图片视频即刻呈现，信息获取更直观!
2、微信支付MCP上线：AI与支付的完美结合，开启商业新纪元
3、谷歌Veo 3视频生成模型向 Pro / Ultra 会员开放，将新增“照片生成视频”功能
4、开源 DeepSeek R1 增强版:推理效率提升200%，降低成本
5、美图WHEE推出“一句话修图”功能
6、芯片设计公司Ambiq Micro申请美国 IPO，受益于生成式AI推动的市场需求
7、昆仑万维再次开源奖励模型Skywork-Reward-V2
8、开源革命！Kyutai TTS发布：超低延迟语音合成，AI语音新纪元来袭！
9、Figma 拟以约 200 亿美元估值登陆纽交所，AI 设计未来可期
10.字节跳动开源 Trae-Agent，助力智能开发新体验

2025年7月8日

1、报道称B站即将推出 “代号 H” AI 创作工具，力推视频播客业务
2、智元发布“哪吒机器人灵犀X2-N”:可轮足双形态切换
3、宇树科技冲刺科创板IPO，百亿估值获阿里腾讯重金加持
4、开源多模态大模型 EarthMind：革新地球观测数据分析的利器
5、Gemini CLI重磅更新！音视频处理+隐私新功能，开发者福音来了！
6、隐形AI桌面助手Glass:开源即爆，智能记录生活点滴
7、Claude 即将发布Claude Neptune v3模型，数学能力超强
8、OpenAI 宣布 GPT-5将整合多种模型，实现全新突破

2025年7月9日

1、腾讯混元推出业界首个美术级3D生成大模型Hunyuan3D-PolyGen
2、阿里HumanOmniV2震撼发布：多模态AI新王者，准确率飙升至69.33
3、钉钉AI表格重磅来袭:1小时处理1000个任务，零门槛搞定数据分析
4、百度AI团队推出PaddleOCR 3.1版
5、微软推出 Deep Research：自动化研究助力科研和商业分析
6、DLoRAL:开源视频高清化框架，香港理工与OPPO联合打造
7、谷歌开源MCP Toolbox for Databases：10行代码解锁AI与数据库的无限可能
8、微软 Win11 即将推出 AI 动态壁纸功能，预览版代码已现

2025年7月10日

1、阿里通义开源支持链式推理的音频生成模型ThinkSound
2、谷歌Veo3重磅升级，支持静态图片生成生动视频
3、Hugging Face发布新一代小参数模型 SmolLM3：128K上下文,双模式推理
4、阿里开源 WebSailor，具备强大的推理和检索能力5、Moonvalley发布Marey Realism v1.5：原生1080P AI视频模型，零版权风险引领行业新风向！
6、Vidu Q1震撼升级:参考转视频支持最多七张图像，AI视频生成再创新高
7、苹果研发类似 ChatGPT AI 客服助手，提升用户支持体验
8、飞书重磅发布多款AI新品，打造企业级“豆包”
9、微软、OpenAI 与 Anthropic 联合推出教育工作者 AI 培训中心
10.昆仑万维重磅发布 Skywork-R1V3.0:跨模态推理能力直逼人类专家!

2025年7月11日

1、xAI 震撼发布Grok4，超强推理+代码神器Grok4 Code
2、微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本
3、上海累计82款大模型已经通过备案
4、Hugging Face 推出 Reachy Mini 机器人，赋能开源 AI 开发者
5、Perplexity AI推出Comet浏览器，挑战谷歌Chrome市场地位
6、OpenAI 计划发布开放权重模型，打破“闭源”惯例
7、谷歌医疗AI模型MedGemma系列上新，单个GPU即可运行
8、OpenAI收购艾维创办的AI硬件公司，交易金额近65亿美元