标签： AI

闪电说：AI语音输入法，比打字快 4 倍，完全免费，无需注册

软件介绍

AI 对话、AI 编程、文档创作、聊天回复，所有应用都支持语音输入，智能语音输入，让文字输入更高效
只需几步简单设置，即可开始使用，支持windows和macOS

刚安装打开需要下载一个890M的语音识别模型，完成后即可离线使用AI语音识别

软件截图

特色功能

毫秒级响应

本地AI，快速准确

绝对隐私

数据不离开设备

AI 纠错

理解语义，智能优化表达

软件下载

官网地址：https://daiti.ai/

新官网：https://shandianshuo.cn/

2025年11月13日
Alle – 让邮件更聪明，更简单，为个人用户打造的AI邮件聚合与管理平台，只需一个域名即可在 Cloudflare Workers 上运行
项目简介

Alle 是一款专为个人用户打造的 邮件聚合与管理平台。
通过整合各个邮箱服务商的 邮件转发功能，Alle 实现了跨账户邮件的 集中接收与统一管理，让用户无需频繁切换邮箱，也能随时掌握全部信息。

以简洁的设计和智能识别为核心，Alle 让邮件管理更高效、更清晰、更安全。

项目截图

功能特点

📬 邮件聚合

Alle 依托于各邮箱服务商的 自动转发功能 来实现聚合。
用户只需在原邮箱中设置转发规则，将邮件自动发送到 Alle 平台提供的专属地址，
即可在一个界面中查看所有邮箱的收件内容。

✅ 支持 Gmail、Outlook、QQ 邮箱等主流邮箱
✅ 支持自定义域名邮箱的转发设置
✅ 无需输入邮箱密码，安全可靠

这种聚合方式避免了多平台登录的麻烦，也降低了安全风险，轻松实现「一处收全邮」。

🤖 AI 识别

Alle 内置的 AI 引擎可对邮件内容进行分析，自动识别并提取关键信息。

识别内容包括：
- 🔐 验证码：自动识别并提取验证码内容，支持快速复制与使用。
- 🔗 链接识别与分类：智能区分邮件中的不同类型链接：
  - 📨 验证链接：用于注册、登录确认、身份验证等场景（如登录 GitHub、验证新设备）。
  - ⚙️ 服务链接：识别来自 GitHub、GitLab、Notion 等服务的通知类链接（如 commit、pull request、任务变更等）。
  - 🚫 订阅链接：识别广告营销邮件中的退订或偏好管理链接，帮助用户快速清理无用订阅。
AI 识别功能让邮件阅读更直观，用户可直接从提取结果中完成操作，大幅提升使用体验。

📨 临时邮箱服务

借助 Cloudflare Workers 的域名邮箱功能，Alle 允许用户快速创建 无限数量的临时邮箱地址。

这些临时邮箱可用于：
- 🧾 注册网站或服务时接收验证码
- 🕵️‍♂️ 保持主邮箱隐私安全
- ⚡ 临时接收一次性信息或测试邮件
所有临时邮箱接收的邮件均会自动汇入主界面，统一管理，避免遗漏。

🛠️ 技术亮点
- 🌩️ 基于 Cloudflare Workers 构建：
  Alle 仅需一个域名即可部署，无需额外服务器或复杂环境配置，
  充分利用边缘计算的高可用与低延迟特性。
- ⚙️ Next.js 架构：
  采用 Next.js 框架开发，拥有高性能渲染能力与良好的开发体验，
  支持服务端渲染（SSR）与静态生成（SSG），确保页面加载快速、稳定。
- 📱 多平台自适应设计：
  使用响应式布局与 Tailwind CSS 样式体系，
  为桌面端与移动端提供一致、流畅的交互体验。
部署指南

Alle 的部署过程极为简洁，只需一个域名即可在 Cloudflare Workers 上运行。
详细部署步骤请参考以下文档：https://github.com/bestruirui/Alle/blob/main/docs/deploy.md

项目地址

github：https://github.com/bestruirui/Alle
2025年11月11日
realdubbing – 免费文本转语音生成器，AI语音将文本转换为自然、高质量的语音
免费AI文本转语音，将您的文本转换为自然语音 – 无限制，无需注册！

AI 文本转语音工具，支持 50 多种语言和 300 多种不同的 AI 声音，最多支持 10000 字，支持声音试听和预览播放，且可使用停顿标签控制语音节奏，完全免费，无需注册。

触手可及的逼真AI语音 RealDubbing，从任何文本生成高质量、听起来自然的音频。我们的免费TTS服务非常适合内容创作者、教育工作者和企业。无需注册，没有限制。

免费无限，自然AI语音，多语言，即时下载

网站介绍

截图

特色

满足您所有语音需求的强大功能

探索使RealDubbing成为最佳免费文本转语音平台的工具。

完全免费，享受无限制的文本转语音生成，包括我们所有的声音和语言，无需任何费用。没有隐藏费用，无需信用卡。

高品质AI语音，访问庞大的自然逼真AI语音库。从300多种选项中为您的内容找到完美的音调和口音。

多语言支持，通过将文本转换为50多种语言和方言的语音，覆盖全球受众，从英语和西班牙语到普通话和阿拉伯语。

语音定制，通过调整语速和音高来微调您的音频。添加停顿，为您的脚本创造完美的表达方式。

SSML支持，利用语音合成标记语言（SSML）对发音、重音和语调进行高级控制。

即时音频下载，立即以MP3格式生成并下载您的音频文件。无需等待，没有水印，只有干净的音频可供使用。

操作步骤

通过我们直观的流程，在几秒钟内将文本转换为高质量音频。
- 输入您的文本，在文本框中键入或粘贴您的脚本。每次生成最多可使用10,000个字符。
- 选择语音和设置，从我们丰富的库中选择一种语言和一种声音。根据您的喜好调整速度和音高。
- 生成和下载，点击生成按钮创建您的音频。预览它并免费下载MP3文件。
网站地址

链接：https://realdubbing.com/zh
2025年11月2日
MuseBot：可本地部署的大模型智能机器人平台，实现自然对话和智能回复
项目介绍

MuseBot是一个基于 Golang 构建的智能机器人，集成了 LLM API，实现 AI 驱动的自然对话与智能回复。
它支持 OpenAI、DeepSeek、Gemini、Doubao、Qwen 等多种大模型，并可无缝接入 Telegram、Discord、Slack、Lark（飞书）、钉钉、企业微信、QQ、微信等聊天平台，为用户带来更加流畅、多平台联通的 AI 对话体验。

截图

功能特性
- 🤖 AI 回复：使用大模型 API 提供聊天机器人回复。
- ⏳ 流式输出：实时发送回复，提升用户体验。
- 🏗 轻松部署：可本地运行或部署到云服务器。
- 👀 图像识别：使用图片与大模型进行交流，详见文档。
- 🎺 支持语音：使用语音与大模型进行交流，详见文档。
- 🐂 函数调用：将 MCP协议转换为函数调用，详见文档。
- 🌊 RAG（检索增强生成）：支持 RAG以填充上下文，详见文档。
- 🌞 管理平台（AdminPlatform）：使用管理平台来管理MuseBot，详见文档。🌞 管理平台（AdminPlatform）：使用管理平台来管理MuseBot，详见文档。
- 🌛 注册中心：支持服务注册，机器人实例可自动注册，详见文档
- 🌈 监控数据：支持监控数据，详见文档。
项目链接

https://github.com/yincongcyincong/MuseBot
2025年10月30日
AI Doctor：AI 医疗会诊面板，纯前端多医生 AI 会诊模拟系统，让AI帮你分析会诊病情病因
AI现在真的强大，用AI来看病会诊也是个不错的方向，开发者DragonChenCL就开发了一套前端AI 医疗会诊面板，让AI帮你看病，配置好AI后，描述你的症状，多个AI医生参与会诊，轮流发言，互相评估，最终诊断你的病情

可添加多个由不同 LLM 驱动的医生。未填写 API Key 将使用模拟回复。本内容仅供参考，身体不适尽早就医

📖 项目简介

AI 医疗会诊面板是一个创新的医疗会诊模拟系统，通过集成多个大语言模型（LLM）扮演不同的医生角色，实现多专家协同诊断。系统采用纯前端架构，无需后端服务器，直接在浏览器中调用各大 AI 服务商的 API。

截图

特性
- 🏥 多医生协作：支持添加多个由不同 LLM 驱动的医生参与会诊
- 🤖 多模型支持：集成 OpenAI、Anthropic Claude、Google Gemini、硅基流动、魔搭社区等主流 AI 模型
- 💬 实时讨论：医生轮流发言，支持打字机效果展示
- 🗳️ 智能评估：医生互相评估彼此的诊断，自动淘汰不准确的意见
- 📊 状态监控：实时显示会诊阶段、轮次、医生状态等信息
- 💾 会话管理：自动保存会诊记录，支持多个问诊会话切换
- 🎨 美观界面：基于 Ant Design Vue 设计，界面简洁直观
- 📱 纯前端：无需服务器，所有数据保存在浏览器本地存储
使用指南

第一步：配置医生
1. 点击右上角的 “设置” 按钮
2. 在 “医生配置” 标签页中添加医生：
  - 输入医生名称（例如：Dr. GPT-4）
  - 选择供应商（OpenAI规范 / Anthropic规范 / Gemini规范 / 硅基流动 / 魔搭社区）
  - 填写对应的 API Key
  - 可选：自定义 Base URL（用于代理或私有部署）
  - 选择或输入模型名称
  - 可选：自定义医生的提示词
3. 点击 “添加医生” 按钮添加更多医生
4. 在 “问诊医生” 标签页中选择参与本次会诊的医生
第二步：输入病例信息
1. 在主页面填写病例信息：
  - 患者姓名（必填）
  - 年龄
  - 既往疾病史
  - 本次问题（必填）
2. 点击 “开始会诊” 按钮
第三步：观察会诊过程
- 医生将轮流发言，提出自己的诊断和建议
- 每轮讨论结束后，医生们会互相评估
- 被多数医生标记为”不太准确”的医生将被淘汰
- 会诊将持续到：
  - 只剩一位医生（该医生的诊断为最终答案）
  - 连续多轮无医生被淘汰（达到设定的上限）
第四步：查看最终答案

会诊结束后，系统会生成一份完整的诊断总结，包括：
- 核心诊断
- 诊断依据
- 鉴别诊断
- 检查建议
- 治疗建议
- 随访计划
- 风险提示
点击 “查看最终答案” 按钮即可查看，还可以导出为图片保存。

项目地址

github：https://dragonchencl.github.io/ai-doctor/

demo：https://dragonchencl.github.io/ai-doctor/
2025年10月30日
Transor：专业的AI翻译工具，网页、文档、图片与视频实时翻译
浏览器扩展介绍

Transor 是一款专业的 AI 翻译工具，帮助你轻松跨越语言障碍。支持文本、文档、图片甚至视频翻译，让你在浏览器中即可无缝阅读和理解全球内容。提供免费的网页、PDF、图片、视频字幕双语翻译，并支持大模型 AI 的高精度专业翻译。

支持 YouTube、Netflix 实时双语字幕翻译，无论观影、学习还是工作，外文内容即看即懂。独创的免费PDF双语翻译功能，让学术论文与商业合同都能一键对照阅读。更有图片翻译、划词翻译、输入框翻译、双语卡片分享等功能，全方位覆盖日常学习与办公场景。

截图

主要功能
- 网页翻译：通过智能识别网页的核心内容区域，实现低侵入性的双语对照翻译，为数百万用户带来了沉浸式的外文网页阅读体验。
- 视频字幕翻译：支持 YouTube、Netflix等主流视频网站的实时双语字幕翻译。原声配合双语字幕，让您既能看懂内容，又能在观影中自然提升外语水平。
- PDF翻译：免费 PDF 翻译，让文档支持双语阅读。依托 AI 翻译服务，无论是学术论文还是商业合同，都能一键获得专业结果。
- 图片翻译：Transor 插件支持网页图片翻译，右键或悬停即可完成。
- 划词翻译：在网页任意文本上选中即可用 AI 翻译成母语，并可一键收藏至个人收藏夹，支持数据导出。
- 输入框翻译：在网页输入框中输入文本后，快速连按 3 次空格即可翻译为目标语言（默认英语，可自定义）。无需跳出页面，搜索、写作、对话场景都能即刻完成翻译，体验更流畅。
- 双语卡片分享：选中网页文本即可生成可分享至社交平台的双语图片，也可在任意页面截图并裁剪，快速生成双语对照分享图。
获取链接

网站地址：https://transor.ai/zh-CN
2025年10月30日
ValueCell：开源金融应用平台，炒股平台，多个AI协作处理市场分析
项目介绍

ValueCell 是一个社区驱动的多智能体金融应用平台。提供顶级的投资智能体团队，帮助您管理投资组合。开源的AI炒股平台，支持大A、美股

通过多个 AI 智能体协作，体分工处理市场分析、帮助用户管理投资组合，涵盖美股、加密货币、港股、A股等多个市场。

另外，ValueCell 是一个基于Python的应用程序，且有完备的前端操作页面。

截图

核心特性

多智能体系统
- Trading Agents：专门负责市场分析、情绪分析、新闻分析和基本面分析的智能体协同工作
- AI-Hedge-Fund：智能体协作提供全面的金融洞察
- SEC Agent：提供来自SEC的实时的推送更新
- 其他智能体：更多智能体正在规划中…
灵活集成
- 多种大语言模型提供商：支持 OpenRouter、OpenAI、Anthropic、Google 和 Ollama
- 热门市场数据：覆盖美国市场、加密货币市场、香港市场、中国市场等
- 多智能体框架兼容：通过 A2A 协议，支持 Langchain、Agno 等主流Agent框架
项目链接

项目地址：https://github.com/ValueCell-ai/valuecell

网站地址：https://valuecell.ai/
2025年10月27日
FireRedTTS-2 – 面向播客和聊天机器人的AI长对话语音生成
概述

FireRedTTS‑2 是一种用于多说话人对话生成的长格式流式 TTS 系统，可提供稳定、自然的语音，具有可靠的说话人切换和上下文感知的韵律。

长对话语音合成系统，可通过提供文本和可选参考音频生成自然流畅的语音输出，支持长对话场景下的连续发言，确保语气与节奏自然连贯，支持中文、英文、日文、韩文、法文、德文及俄文，具备零样本语音克隆能力，适用于播客、聊天机器人等多发言人场景，免费开源，使用 Python 开发。

亮点🔥
- 长对话语音生成：目前支持 4 位说话者的 3 分钟对话，并且可以通过扩展训练语料库轻松扩展到更多说话者的更长对话。
- 多语言支持：支持英语、中文、日语、韩语、法语、德语、俄语等多种语言。支持零样本语音克隆，适用于跨语言和代码切换场景。
- 超低延迟：基于新的12.5Hz 流式语音标记器，我们采用了双变压器架构，该架构在文本语音交错序列上运行，从而实现了灵活的逐句生成并减少了首包延迟。具体而言，在 L20 GPU 上，我们的首包延迟低至 140ms，同时保持高质量的音频输出。
- 强稳定性：我们的模型在独白和对话测试中都实现了高相似度和低WER/CER。
- 随机音色生成：用于创建 ASR/语音交互数据。
演示

随机音色生成和多语言支持 多语言360p.mp4

零样本播客生成 聊天克隆_360p.mp4

针对特定演讲者进行精细调整的播客生成

⚠️演讲者声音：播客《肥话连篇》主持人“肥杰”和“惠子”。未经授权禁止使用。

⚠️声音来源：播客《肥话连篇》主播“肥杰”和“惠子”，尚未授权不能使用。演示_v7_360p.mp4

项目地址

github：https://github.com/FireRedTeam/FireRedTTS2
2025年10月25日
AI图像生成器：在线免费生成和编辑图片，支持商用
网站介绍

AI图像生成器，在线文本转换图像的工具网站。支持编辑、增强和优化照片，免费使用，无须注册。

支持选择图片大小，支持一键抠图，支持一键导出PNG、WebP、AVIF、JPEG格式。

网站截图

核心功能
- 质量与格式Flux Schnell原生1024px采样，可选2倍-4倍放大（最大8192×8192）。一键导出PNG、WebP、AVIF、JPEG。
- 速度≈1秒/图像典型。4张批量约4秒完成，带流式预览。
- 隐私与安全提示词和输出不保留用于训练。临时缓存<24小时。传输中使用TLS，存储中使用AES-256。
- 分辨率与放大以1024px生成；确定性放大路径至2K、4K和8K，带边缘+颜色保真度检查。
- 批量与并行每个提示最多8张图像（免费）或16张（专业版）；并行排队作业，带种子锁定以确保一致性。
- 多语言支持UI和提示词本地化（英文、德文、西班牙文、法文、日文、中文），即时语言切换和自动检测。
网站链接

https://freeaiimage.net/zh
2025年10月23日
Aicrop – AI智能社交媒体图片裁剪工具，上传一张图片，自动生成所有社交平台尺寸，完全免费，无水印，无需注册
AI智能社交媒体图片裁剪工具，上传一张图片，自动生成所有社交平台尺寸。AI智能识别主体并保持居中。完全免费，无水印，无需注册。所有处理在浏览器本地完成，图片不会上传到服务器

在日常创作中，无论是做社交媒体内容、博客封面还是宣传素材，我们经常需要为不同平台（如 Instagram、X/Twitter、TikTok、LinkedIn、YouTube 等）调整图片尺寸与比例。这本是一件琐碎且重复的工作——不仅耗时，还容易让主体偏位或构图失衡。

AICrop 就是为了解决这个问题而生的一款小工具。它由我与 Claude Code 一起通过 “vibe coding” 协作方式开发完成，核心理念是：自动化、轻量、隐私优先。

网站截图

功能特色
- AI智能识别先进的TensorFlow.js模型自动识别图片中的人物、物体和关键主体。
- 智能裁剪算法智能裁剪确保主体在所有长宽比中都保持居中和可见。
- 隐私优先设计所有图像处理都在浏览器本地完成，无上传、无数据收集、无跟踪。
- 通过AI智能裁剪节省手工工作时间，完美适配内容创作者和企业需求。
- 一次上传，多种尺寸
- AI主体识别
- 永久免费
- 无水印、无需注册、无使用限制。尽情使用AICrop，完全免费。
- 10+平台支持
- 支持Instagram (1:1, 9:16, 16:9)、Twitter (16:9, 3:1)、LinkedIn (4:5)、Facebook、YouTube、TikTok等。
- 识别80+种物体类型，包括人物、人脸、动物、车辆和常见物体，准确率达95%+。
- 智能裁剪算法
- 智能定位保持主体居中，同时处理大主体或边缘主体等特殊情况。
- 实时预览
- 下载前即可通过并排预览查看所有裁剪版本的效果。
- 手动调整
- 如果AI建议需要调整，可手动微调裁剪位置。拖拽重新定位、调整裁剪区域大小。
网站链接

官网地址：https://aicrop.app
2025年10月19日