人工智能

人工智能前沿资讯

Google Meet will take AI notes for in-person meetings too

Google Meet will take AI notes for in-person meetings too

Google's AI meeting notetaker is no longer limited to Google Meets - Gemini can also generate summaries and transcripts of in-person meetings now, as well as meetings on Zoom and Microsoft Teams, as f...

[分享创造] Rust 写的 ML 驱动的本地漫画翻译器,一键汉化本子!

[分享创造] Rust 写的 ML 驱动的本地漫画翻译器,一键汉化本子!

写这个项目差不多有一年了,现在 GitHub 上差不多有了 4K 星星了! Koharu 是用 Rust 写的漫画翻译器,内置目标识别、基于视觉 LLM 的 OCR 、结构分析、遮罩识别、图像修复模型,基于 DAG 的流水线,可以自行组合喜欢的模型。 并且内置 llama.cpp 与多种翻译 LLM ,全部本地运行,包括 Gemma4 ,Qwen3.5 的 NSFW 版本。也有调优的 Sakur...

[分享创造] Rust 写的 ML 驱动的本地漫画翻译器,一键汉化本子!

[分享创造] Rust 写的 ML 驱动的本地漫画翻译器,一键汉化本子!

写这个项目差不多有一年了,现在 GitHub 上差不多有了 4K 星星了! Koharu 是用 Rust 写的漫画翻译器,内置目标识别、基于视觉 LLM 的 OCR 、结构分析、遮罩识别、图像修复模型,基于 DAG 的流水线,可以自行组合喜欢的模型。 并且内置 llama.cpp 与多种翻译 LLM ,全部本地运行,包括 Gemma4 ,Qwen3.5 的 NSFW 版本。也有调优的 Sakur...

📄

Show HN: Broccoli, one shot coding agent on the cloud

Hi HN — we built Broccoli, an open-source harness for taking coding tasks from Linear, running them in isolated cloud sandboxes, and opening PRs for a human to review.We’re a small team, and our main ...

📄

[问与答] 大家会让 AI 访问你的邮件和工作聊天软件吗?

我平时工作会把 Outlook,Slack ,MS Teams,GitHub,Jira 等常用工作软件和 AI Agent 集成,然后指挥 AI 干活。 像 GitHub 有 gh cli ,但其他很多网站没有类似 cli ,我知道有些工具可以将网站转成 cli ,或者用 Agent Browser 去操作这些网站。但是这些手段要么慢,要么费 token ,我的做法是给每个系统做一个 Skill ...

标配8255芯片与CDC,奇瑞试图终结“燃油车无智驾”时代

标配8255芯片与CDC,奇瑞试图终结“燃油车无智驾”时代

2026年,当大模型与端到端被默认打上“新能源专属”的标签时,燃油车是否注定被智能时代抛弃?奇瑞试图用一种近乎“重写底层代码”的方式给出否定答案。4月22日,全新一代瑞虎9在北京正式上市 。这不仅是奇瑞新燃油战略的一枚重磅落子,更是这家“理工男”车企试图在智能化深水区,为庞大的燃油车基本盘抢回“数字主权”的一次极限突围 。PART 1机械底座的抗衡:用96.6%传动效率对抗电驱爆发力燃油车要在智能...

[程序员] 赛博斗蛐蛐, AI 模型的简单对比(白嫖版)

[程序员] 赛博斗蛐蛐, AI 模型的简单对比(白嫖版)

目前对于各 AI 应用的需求没有太深入,只是当作日常生活自动化的补充,更像是个人助手,并且 Gemini 3 flash preview 和 Grok 足够用,所以也没到订阅的程度,就一直在免费的几家里面来回切换,之前还一直用 Grok ,但是晚上用老是提示繁忙,就换成 Gemini 了。平时的需求也不复杂,没有长的上下文,正好这次遇到了脚本相关的任务和规划类任务,就在几个 AI 产品里都跑了下。...

[程序员] 赛博斗蛐蛐, AI 模型的简单对比(白嫖版)

[程序员] 赛博斗蛐蛐, AI 模型的简单对比(白嫖版)

目前对于各 AI 应用的需求没有太深入,只是当作日常生活自动化的补充,更像是个人助手,并且 Gemini 3 flash preview 和 Grok 足够用,所以也没到订阅的程度,就一直在免费的几家里面来回切换,之前还一直用 Grok ,但是晚上用老是提示繁忙,就换成 Gemini 了。平时的需求也不复杂,没有长的上下文,正好这次遇到了脚本相关的任务和规划类任务,就在几个 AI 产品里都跑了下。...

📄

[问与答] 关于我做了一个自嗨的语音助手,愿景是小白也能通过自然语言轻松操控电脑或手机(跪求大佬指点)

因为市面上没有一个真正好用的语音助手,帮助我释放双手,并且现在主流的智能体助手,像豆包,Gemini 等,因为过于通用化而显得有时候很弱智和胡说八道,也出于对童年魔幻手机里的傻妞这样的人工智能的憧憬,所以自嗨了一个语音智能体 这个智能体能够记得我上次的对话,熟悉我的情绪,不会一味的附和我,甚至在我偷懒提问时直接“怼”我,引导我独立思考,会不会组成一个真正的伙伴 它能够扮演任何角色,导师,朋友,...

📄

Google Gemini接入Google Photos 支持从相册生成个性化AI图像

Google近日在 Gemini 中上线一项与 Google Photos 深度绑定的新功能,允许这款 AI 助手直接从用户的照片库中提取信息,用于生成更具个人化色彩的图像内容。Google的目标是让系统在创作 AI 图片时,能够“使用你和你所爱之人的真实影像”,而不是仅依赖用户在提示词中对外貌、家庭成员和个人风格进行冗长描述。 阅读全文

📄

Google与Thinking Machines Lab达成数十亿美元云计算深度合作

据知情人士透露,Google近日与人工智能初创公司 Thinking Machines Lab 达成一项全新的多年期云计算和战略合作协议,交易规模高达数十亿美元,标志着这家搜索巨头正加大在前沿大模型客户上的投入力度。 此次协议是在 Thinking Machines Lab 先前与英伟达签署大规模算力采购合作之后达成,意味着该公司在底层芯片与云平台两端同时绑定行业领先供应商。 阅读全文