详情
评论
问答

2025年07月01——11日AI大事分享

温馨提示: 本文最后更新于2025-07-11 10:22:03,某些文章具有时效性,若有错误或已失效,请在下方留言或联系青争社客服
图片[1]-2025年07月01——11日AI大事分享-青争开放社区

2025年7月1日

01 大模型:谷歌Gemini 2.5 Pro API免费回归,百度开源文心4.5系列,华为则推出了720亿参数的盘古Pro MoE模型。
02 脑机接口:Neuralink的N1脑机接口取得显著进展,已帮助七名受试者通过意念控制设备,并计划在2028年实现全脑接口。
03 绘图:Koboldcpp通过支持Flux Kontext,为用户提供了比ComfyUI更简洁易用的修图体验。
04 金融:开源AI项目MIT的TradingAgents实现高回报,同时涌现出QuantLib、Kungfu和K-Quant等专业的量化交易与分析工具。
05 音频:Qwen团队发布了支持多语言及中文方言的文本转语音工具Qwen-TTS,目前通过API提供服务。
06 智能体:Kimi推出的深度研究Agent通过主动规划与多轮推理生成研究报告,在全球HLE考试中首次取得领先成绩。
07 案例:游戏化陪伴应用EVE、利用Gemini CLI高效整理笔记,以及结合大模型实现智能化的MySQL数据库运维。
08 编程:谷歌OpenEvolve能自动发现高性能算法,而Fusion AI则可将设计稿快速转为代码。
09 RAG:香港大学推出开源多模态RAG系统RAG-Anything,通过构建统一知识图谱处理包含文字、图像、表格等复杂文档。
10 报告:Iconiq Capital的《2025年AI现状报告》指出,AI正进入实战落地阶段,企业需关注成本控制与灵活产品策略,同时数据显示数据处理费用已超过训练成本。

2025年7月3日

1、开源端到端语音大模型Step-Audio-AQAA:听懂音频直接生成自然语音
2、百度发布“绘想”平台与MuseSteamer:AI生成视频,一张图即可搞定专业级大片!
3、浙大与阿里联合发布OmniAvatar:音频驱动全身数字人模型震撼登场
4、百度搜索迎来十年来最大改版:AI智能框、百看、AI助手全面进化
5、xAI控制台新增Grok4及Grok4Code引用,标志着下一代AI模型即将发布
6、Gemini Live重磅升级!无缝连接Google应用,智能生活触手可及
7、武汉首发全国首辆 AI 外卖配送车,配送效率大幅提升
8、Anthropic年化收入已达40亿美元,较年初增长近4倍、与 Cursor 竞争加剧

2025年7月4日

1、字节跳动EX-4D震撼开源:单目视频秒变自由视角4D大片
2、Bilibili开源动漫视频生成模型AniSora V3版,一键生成多种风格动漫视频镜头
3、DeepSWE 开源 AI Agent系统强势登顶,基于 Qwen3-32B
4、字节跳动开源新模型VINCIE-3B:3亿参数,支持上下文连续图像编辑
5、Stability AI开源Stable Audio Open Small,手机秒变音频创作神器
6、谷歌重磅发布Gemini for Education!免费AI工具席卷全球教育
7、Topview Avatar 2震撼发布!AI数字人革新电商带货,模特时代终结?
8、Perplexity推出Max订阅计划:每月200美元解锁无限AI生产力
9、Cursor 大胆挖人!Claude Code 核心人物转投竞争对手
10、OpenAI 声明:Robinhood 推出的 “OpenAI 代币” 与我们无关

2025年7月7日

1、腾讯元宝再升级:一句话搜索,图片视频即刻呈现,信息获取更直观!
2、微信支付MCP上线:AI与支付的完美结合,开启商业新纪元
3、谷歌Veo 3视频生成模型向 Pro / Ultra 会员开放,将新增“照片生成视频”功能
4、开源 DeepSeek R1 增强版:推理效率提升200%,降低成本
5、美图WHEE推出“一句话修图”功能
6、芯片设计公司Ambiq Micro申请美国 IPO,受益于生成式AI推动的市场需求
7、昆仑万维再次开源奖励模型Skywork-Reward-V2
8、开源革命!Kyutai TTS发布:超低延迟语音合成,AI语音新纪元来袭!
9、Figma 拟以约 200 亿美元估值登陆纽交所,AI 设计未来可期
10.字节跳动开源 Trae-Agent,助力智能开发新体验

2025年7月8日

1、报道称B站即将推出 “代号 H” AI 创作工具,力推视频播客业务
2、智元发布“哪吒机器人灵犀X2-N”:可轮足双形态切换
3、宇树科技冲刺科创板IPO,百亿估值获阿里腾讯重金加持
4、开源多模态大模型 EarthMind:革新地球观测数据分析的利器
5、Gemini CLI重磅更新!音视频处理+隐私新功能,开发者福音来了!
6、隐形AI桌面助手Glass:开源即爆,智能记录生活点滴
7、Claude 即将发布Claude Neptune v3模型,数学能力超强
8、OpenAI 宣布 GPT-5将整合多种模型,实现全新突破

2025年7月9日

1、腾讯混元推出业界首个美术级3D生成大模型Hunyuan3D-PolyGen
2、阿里HumanOmniV2震撼发布:多模态AI新王者,准确率飙升至69.33
3、钉钉AI表格重磅来袭:1小时处理1000个任务,零门槛搞定数据分析
4、百度AI团队推出PaddleOCR 3.1版
5、微软推出 Deep Research:自动化研究助力科研和商业分析
6、DLoRAL:开源视频高清化框架,香港理工与OPPO联合打造
7、谷歌开源MCP Toolbox for Databases:10行代码解锁AI与数据库的无限可能
8、微软 Win11 即将推出 AI 动态壁纸功能,预览版代码已现

2025年7月10日

1、阿里通义开源支持链式推理的音频生成模型ThinkSound
2、谷歌Veo3重磅升级,支持静态图片生成生动视频
3、Hugging Face发布新一代小参数模型 SmolLM3:128K上下文,双模式推理
4、阿里开源 WebSailor,具备强大的推理和检索能力5、Moonvalley发布Marey Realism v1.5:原生1080P AI视频模型,零版权风险引领行业新风向!
6、Vidu Q1震撼升级:参考转视频支持最多七张图像,AI视频生成再创新高
7、苹果研发类似 ChatGPT AI 客服助手,提升用户支持体验
8、飞书重磅发布多款AI新品,打造企业级“豆包”
9、微软、OpenAI 与 Anthropic 联合推出教育工作者 AI 培训中心
10.昆仑万维重磅发布 Skywork-R1V3.0:跨模态推理能力直逼人类专家!

2025年7月11日

1、xAI 震撼发布Grok4,超强推理+代码神器Grok4 Code
2、微软全新 Phi-4-mini 版发布:推理效率提升 10 倍,轻松适配笔记本
3、上海累计82款大模型已经通过备案
4、Hugging Face 推出 Reachy Mini 机器人,赋能开源 AI 开发者
5、Perplexity AI推出Comet浏览器,挑战谷歌Chrome市场地位
6、OpenAI 计划发布开放权重模型,打破“闭源”惯例
7、谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行
8、OpenAI收购艾维创办的AI硬件公司,交易金额近65亿美元

本站资源均为作者提供和网友推荐收集整理而来,仅供学习和研究使用,请在下载后24小时内删除,谢谢合作!
© 版权声明
THE END
青争社 · 连接全球资源
分享
评论 抢沙发

请登录后发表评论

    暂无评论内容