标签: AI

  • 闪电说:AI语音输入法,比打字快 4 倍,完全免费,无需注册

    软件介绍

    AI 对话、AI 编程、文档创作、聊天回复,所有应用都支持语音输入,智能语音输入,让文字输入更高效
    只需几步简单设置,即可开始使用,支持windows和macOS

    刚安装打开需要下载一个890M的语音识别模型,完成后即可离线使用AI语音识别

    软件截图

    特色功能

    毫秒级响应

    本地AI,快速准确

    绝对隐私

    数据不离开设备

    AI 纠错

    理解语义,智能优化表达

    软件下载

    官网地址:https://daiti.ai/

    新官网:https://shandianshuo.cn/

  • Alle – 让邮件更聪明,更简单,为个人用户打造的AI邮件聚合与管理平台,只需一个域名即可在 Cloudflare Workers 上运行

    项目简介

    Alle 是一款专为个人用户打造的 邮件聚合与管理平台
    通过整合各个邮箱服务商的 邮件转发功能,Alle 实现了跨账户邮件的 集中接收与统一管理,让用户无需频繁切换邮箱,也能随时掌握全部信息。

    以简洁的设计和智能识别为核心,Alle 让邮件管理更高效、更清晰、更安全。

    项目截图

    功能特点

    📬 邮件聚合

    Alle 依托于各邮箱服务商的 自动转发功能 来实现聚合。
    用户只需在原邮箱中设置转发规则,将邮件自动发送到 Alle 平台提供的专属地址,
    即可在一个界面中查看所有邮箱的收件内容。

    ✅ 支持 Gmail、Outlook、QQ 邮箱 等主流邮箱
    ✅ 支持自定义域名邮箱的转发设置
    ✅ 无需输入邮箱密码,安全可靠

    这种聚合方式避免了多平台登录的麻烦,也降低了安全风险,轻松实现「一处收全邮」。


    🤖 AI 识别

    Alle 内置的 AI 引擎可对邮件内容进行分析,自动识别并提取关键信息。

    识别内容包括:

    • 🔐 验证码:自动识别并提取验证码内容,支持快速复制与使用。
    • 🔗 链接识别与分类:智能区分邮件中的不同类型链接:
      • 📨 验证链接:用于注册、登录确认、身份验证等场景(如登录 GitHub、验证新设备)。
      • ⚙️ 服务链接:识别来自 GitHub、GitLab、Notion 等服务的通知类链接(如 commit、pull request、任务变更等)。
      • 🚫 订阅链接:识别广告营销邮件中的退订或偏好管理链接,帮助用户快速清理无用订阅。

    AI 识别功能让邮件阅读更直观,用户可直接从提取结果中完成操作,大幅提升使用体验。


    📨 临时邮箱服务

    借助 Cloudflare Workers 的域名邮箱功能,Alle 允许用户快速创建 无限数量的临时邮箱地址

    这些临时邮箱可用于:

    • 🧾 注册网站或服务时接收验证码
    • 🕵️‍♂️ 保持主邮箱隐私安全
    • ⚡ 临时接收一次性信息或测试邮件

    所有临时邮箱接收的邮件均会自动汇入主界面,统一管理,避免遗漏。


    🛠️ 技术亮点

    • 🌩️ 基于 Cloudflare Workers 构建
      Alle 仅需一个域名即可部署,无需额外服务器或复杂环境配置,
      充分利用边缘计算的高可用与低延迟特性。
    • ⚙️ Next.js 架构
      采用 Next.js 框架开发,拥有高性能渲染能力与良好的开发体验,
      支持服务端渲染(SSR)与静态生成(SSG),确保页面加载快速、稳定。
    • 📱 多平台自适应设计
      使用响应式布局与 Tailwind CSS 样式体系,
      为桌面端与移动端提供一致、流畅的交互体验。

    部署指南

    Alle 的部署过程极为简洁,只需一个域名即可在 Cloudflare Workers 上运行。
    详细部署步骤请参考以下文档:https://github.com/bestruirui/Alle/blob/main/docs/deploy.md

    项目地址

    github:https://github.com/bestruirui/Alle

  • realdubbing – 免费文本转语音生成器,AI语音将文本转换为自然、高质量的语音

    免费AI文本转语音,将您的文本转换为自然语音 – 无限制,无需注册!

    AI 文本转语音工具,支持 50 多种语言和 300 多种不同的 AI 声音,最多支持 10000 字,支持声音试听和预览播放,且可使用停顿标签控制语音节奏,完全免费,无需注册。

    触手可及的逼真AI语音 RealDubbing,从任何文本生成高质量、听起来自然的音频。我们的免费TTS服务非常适合内容创作者、教育工作者和企业。无需注册,没有限制。

    免费无限,自然AI语音,多语言,即时下载

    网站介绍

    截图

    特色

    满足您所有语音需求的强大功能

    探索使RealDubbing成为最佳免费文本转语音平台的工具。

    完全免费,享受无限制的文本转语音生成,包括我们所有的声音和语言,无需任何费用。没有隐藏费用,无需信用卡。

    高品质AI语音,访问庞大的自然逼真AI语音库。从300多种选项中为您的内容找到完美的音调和口音。

    多语言支持,通过将文本转换为50多种语言和方言的语音,覆盖全球受众,从英语和西班牙语到普通话和阿拉伯语。

    语音定制,通过调整语速和音高来微调您的音频。添加停顿,为您的脚本创造完美的表达方式。

    SSML支持,利用语音合成标记语言(SSML)对发音、重音和语调进行高级控制。

    即时音频下载,立即以MP3格式生成并下载您的音频文件。无需等待,没有水印,只有干净的音频可供使用。

    操作步骤

    通过我们直观的流程,在几秒钟内将文本转换为高质量音频。

    • 输入您的文本,在文本框中键入或粘贴您的脚本。每次生成最多可使用10,000个字符。
    • 选择语音和设置,从我们丰富的库中选择一种语言和一种声音。根据您的喜好调整速度和音高。
    • 生成和下载,点击生成按钮创建您的音频。预览它并免费下载MP3文件。

    网站地址

    链接:https://realdubbing.com/zh

  • MuseBot:可本地部署的大模型智能机器人平台 ,实现自然对话和智能回复

    项目介绍

    MuseBot是一个基于 Golang 构建的 智能机器人,集成了 LLM API,实现 AI 驱动的自然对话与智能回复。
    它支持 OpenAI、DeepSeek、Gemini、Doubao、Qwen 等多种大模型,并可无缝接入 Telegram、Discord、Slack、Lark(飞书)、钉钉、企业微信、QQ、微信 等聊天平台,为用户带来更加流畅、多平台联通的 AI 对话体验。

    截图

    功能特性

    • 🤖 AI 回复:使用 大模型 API 提供聊天机器人回复。
    • ⏳ 流式输出:实时发送回复,提升用户体验。
    • 🏗 轻松部署:可本地运行或部署到云服务器。
    • 👀 图像识别:使用图片与 大模型进行交流,详见文档
    • 🎺 支持语音:使用语音与 大模型进行交流,详见文档
    • 🐂 函数调用:将 MCP协议转换为函数调用,详见文档
    • 🌊 RAG(检索增强生成):支持 RAG以填充上下文,详见文档
    • 🌞 管理平台(AdminPlatform):使用管理平台来管理MuseBot,详见文档。🌞 管理平台(AdminPlatform) :使用管理平台来管理MuseBot,详见文档 。
    • 🌛 注册中心:支持服务注册,机器人实例可自动注册,详见 文档
    • 🌈 监控数据:支持监控数据,详见文档

    项目链接

    https://github.com/yincongcyincong/MuseBot

  • AI Doctor:AI 医疗会诊面板,纯前端多医生 AI 会诊模拟系统,让AI帮你分析会诊病情病因

    AI现在真的强大,用AI来看病会诊也是个不错的方向,开发者DragonChenCL就开发了一套前端AI 医疗会诊面板,让AI帮你看病,配置好AI后,描述你的症状,多个AI医生参与会诊,轮流发言,互相评估,最终诊断你的病情

    可添加多个由不同 LLM 驱动的医生。未填写 API Key 将使用模拟回复。本内容仅供参考,身体不适尽早就医

    📖 项目简介

    AI 医疗会诊面板是一个创新的医疗会诊模拟系统,通过集成多个大语言模型(LLM)扮演不同的医生角色,实现多专家协同诊断。系统采用纯前端架构,无需后端服务器,直接在浏览器中调用各大 AI 服务商的 API。

    截图

    特性

    • 🏥 多医生协作:支持添加多个由不同 LLM 驱动的医生参与会诊
    • 🤖 多模型支持:集成 OpenAI、Anthropic Claude、Google Gemini、硅基流动、魔搭社区等主流 AI 模型
    • 💬 实时讨论:医生轮流发言,支持打字机效果展示
    • 🗳️ 智能评估:医生互相评估彼此的诊断,自动淘汰不准确的意见
    • 📊 状态监控:实时显示会诊阶段、轮次、医生状态等信息
    • 💾 会话管理:自动保存会诊记录,支持多个问诊会话切换
    • 🎨 美观界面:基于 Ant Design Vue 设计,界面简洁直观
    • 📱 纯前端:无需服务器,所有数据保存在浏览器本地存储

    使用指南

    第一步:配置医生

    1. 点击右上角的 “设置” 按钮
    2. 在 “医生配置” 标签页中添加医生:
      • 输入医生名称(例如:Dr. GPT-4)
      • 选择供应商(OpenAI规范 / Anthropic规范 / Gemini规范 / 硅基流动 / 魔搭社区)
      • 填写对应的 API Key
      • 可选:自定义 Base URL(用于代理或私有部署)
      • 选择或输入模型名称
      • 可选:自定义医生的提示词
    3. 点击 “添加医生” 按钮添加更多医生
    4. 在 “问诊医生” 标签页中选择参与本次会诊的医生

    第二步:输入病例信息

    1. 在主页面填写病例信息:
      • 患者姓名(必填)
      • 年龄
      • 既往疾病史
      • 本次问题(必填)
    2. 点击 “开始会诊” 按钮

    第三步:观察会诊过程

    • 医生将轮流发言,提出自己的诊断和建议
    • 每轮讨论结束后,医生们会互相评估
    • 被多数医生标记为”不太准确”的医生将被淘汰
    • 会诊将持续到:
      • 只剩一位医生(该医生的诊断为最终答案)
      • 连续多轮无医生被淘汰(达到设定的上限)

    第四步:查看最终答案

    会诊结束后,系统会生成一份完整的诊断总结,包括:

    • 核心诊断
    • 诊断依据
    • 鉴别诊断
    • 检查建议
    • 治疗建议
    • 随访计划
    • 风险提示

    点击 “查看最终答案” 按钮即可查看,还可以导出为图片保存。

    项目地址

    github:https://dragonchencl.github.io/ai-doctor/

    demo:https://dragonchencl.github.io/ai-doctor/

  • Transor:专业的AI翻译工具,网页、文档、图片与视频实时翻译

    浏览器扩展介绍

    Transor 是一款专业的 AI 翻译工具,帮助你轻松跨越语言障碍。支持文本、文档、图片甚至视频翻译,让你在浏览器中即可无缝阅读和理解全球内容。提供免费的网页、PDF、图片、视频字幕双语翻译,并支持大模型 AI 的高精度专业翻译。

    支持 YouTube、Netflix 实时双语字幕翻译,无论观影、学习还是工作,外文内容即看即懂。独创的 免费PDF双语翻译功能,让学术论文与商业合同都能一键对照阅读。更有 图片翻译、划词翻译、输入框翻译、双语卡片分享等功能,全方位覆盖日常学习与办公场景。

    截图

    主要功能

    • 网页翻译:通过智能识别网页的核心内容区域,实现低侵入性的双语对照翻译,为数百万用户带来了沉浸式的外文网页阅读体验。
    • 视频字幕翻译:支持 YouTube、Netflix等主流视频网站的实时双语字幕翻译。原声配合双语字幕,让您既能看懂内容,又能在观影中自然提升外语水平。
    • PDF翻译:免费 PDF 翻译,让文档支持双语阅读。依托 AI 翻译服务,无论是学术论文还是商业合同,都能一键获得专业结果。
    • 图片翻译:Transor 插件支持网页图片翻译,右键或悬停即可完成。
    • 划词翻译:在网页任意文本上选中即可用 AI 翻译成母语,并可一键收藏至个人收藏夹,支持数据导出。
    • 输入框翻译:在网页输入框中输入文本后,快速连按 3 次空格即可翻译为目标语言(默认英语,可自定义)。无需跳出页面,搜索、写作、对话场景都能即刻完成翻译,体验更流畅。
    • 双语卡片分享:选中网页文本即可生成可分享至社交平台的双语图片,也可在任意页面截图并裁剪,快速生成双语对照分享图。

    获取链接

    网站地址:https://transor.ai/zh-CN

  • ValueCell:开源金融应用平台,炒股平台,多个AI协作处理市场分析

    项目介绍

    ValueCell 是一个社区驱动的多智能体金融应用平台。提供顶级的投资智能体团队,帮助您管理投资组合。开源的AI炒股平台,支持大A、美股

    通过多个 AI 智能体协作,体分工处理市场分析、帮助用户管理投资组合,涵盖美股、加密货币、港股、A股等多个市场。

    另外,ValueCell 是一个基于Python的应用程序,且有完备的前端操作页面。

    截图

    核心特性

    多智能体系统

    • Trading Agents:专门负责市场分析、情绪分析、新闻分析和基本面分析的智能体协同工作
    • AI-Hedge-Fund:智能体协作提供全面的金融洞察
    • SEC Agent:提供来自SEC的实时的推送更新
    • 其他智能体:更多智能体正在规划中…

    灵活集成

    • 多种大语言模型提供商:支持 OpenRouter、OpenAI、Anthropic、Google 和 Ollama
    • 热门市场数据:覆盖美国市场、加密货币市场、香港市场、中国市场等
    • 多智能体框架兼容:通过 A2A 协议,支持 Langchain、Agno 等主流Agent框架

    项目链接

    项目地址:https://github.com/ValueCell-ai/valuecell

    网站地址:https://valuecell.ai/

  • FireRedTTS-2 – 面向播客和聊天机器人的AI长对话语音生成

    概述

    FireRedTTS‑2 是一种用于多说话人对话生成的长格式流式 TTS 系统,可提供稳定、自然的语音,具有可靠的说话人切换和上下文感知的韵律。

    长对话语音合成系统,可通过提供文本和可选参考音频生成自然流畅的语音输出,支持长对话场景下的连续发言,确保语气与节奏自然连贯,支持中文、英文、日文、韩文、法文、德文及俄文,具备零样本语音克隆能力,适用于播客、聊天机器人等多发言人场景,免费开源,使用 Python 开发。

    亮点🔥

    • 长对话语音生成:目前支持 4 位说话者的 3 分钟对话,并且可以通过扩展训练语料库轻松扩展到更多说话者的更长对话。
    • 多语言支持:支持英语、中文、日语、韩语、法语、德语、俄语等多种语言。支持零样本语音克隆,适用于跨语言和代码切换场景。
    • 超低延迟:基于新的12.5Hz 流式语音标记器,我们采用了双变压器架构,该架构在文本语音交错序列上运行,从而实现了灵活的逐句生成并减少了首包延迟。具体而言,在 L20 GPU 上,我们的首包延迟低至 140ms,同时保持高质量的音频输出。
    • 强稳定性:我们的模型在独白和对话测试中都实现了高相似度和低WER/CER。
    • 随机音色生成:用于创建 ASR/语音交互数据。

    演示

    随机音色生成和多语言支持 多语言360p.mp4 

    零样本播客生成 聊天克隆_360p.mp4 

    针对特定演讲者进行精细调整的播客生成

    ⚠️演讲者声音:播客《肥话连篇》主持人“肥杰”和“惠子”。未经授权禁止使用。

    ⚠️声音来源:播客《肥话连篇》主播“肥杰”和“惠子”,尚未授权不能使用。 演示_v7_360p.mp4 

    项目地址

    github:https://github.com/FireRedTeam/FireRedTTS2

  • AI图像生成器:在线免费生成和编辑图片,支持商用

    网站介绍

    AI图像生成器,在线文本转换图像的工具网站。支持编辑、增强和优化照片,免费使用,无须注册。

    支持选择图片大小,支持一键抠图,支持一键导出PNG、WebP、AVIF、JPEG格式。

    网站截图

    核心功能

    • 质量与格式Flux Schnell原生1024px采样,可选2倍-4倍放大(最大8192×8192)。一键导出PNG、WebP、AVIF、JPEG。
    • 速度≈1秒/图像典型。4张批量约4秒完成,带流式预览。
    • 隐私与安全提示词和输出不保留用于训练。临时缓存<24小时。传输中使用TLS,存储中使用AES-256。
    • 分辨率与放大以1024px生成;确定性放大路径至2K、4K和8K,带边缘+颜色保真度检查。
    • 批量与并行每个提示最多8张图像(免费)或16张(专业版);并行排队作业,带种子锁定以确保一致性。
    • 多语言支持UI和提示词本地化(英文、德文、西班牙文、法文、日文、中文),即时语言切换和自动检测。

    网站链接

    https://freeaiimage.net/zh

  • Aicrop – AI智能社交媒体图片裁剪工具,上传一张图片,自动生成所有社交平台尺寸,完全免费,无水印,无需注册

    AI智能社交媒体图片裁剪工具,上传一张图片,自动生成所有社交平台尺寸。AI智能识别主体并保持居中。完全免费,无水印,无需注册。所有处理在浏览器本地完成,图片不会上传到服务器

    在日常创作中,无论是做社交媒体内容、博客封面还是宣传素材,我们经常需要为不同平台(如 Instagram、X/Twitter、TikTok、LinkedIn、YouTube 等)调整图片尺寸与比例。这本是一件琐碎且重复的工作——不仅耗时,还容易让主体偏位或构图失衡。

    AICrop 就是为了解决这个问题而生的一款小工具。它由我与 Claude Code 一起通过 “vibe coding” 协作方式开发完成,核心理念是:自动化、轻量、隐私优先

    网站截图

    功能特色

    • AI智能识别先进的TensorFlow.js模型自动识别图片中的人物、物体和关键主体。
    • 智能裁剪算法智能裁剪确保主体在所有长宽比中都保持居中和可见。
    • 隐私优先设计所有图像处理都在浏览器本地完成,无上传、无数据收集、无跟踪。
    • 通过AI智能裁剪节省手工工作时间,完美适配内容创作者和企业需求。
    • 一次上传,多种尺寸
    • AI主体识别
    • 永久免费
    • 无水印、无需注册、无使用限制。尽情使用AICrop,完全免费。
    • 10+平台支持
    • 支持Instagram (1:1, 9:16, 16:9)、Twitter (16:9, 3:1)、LinkedIn (4:5)、Facebook、YouTube、TikTok等。
    • 识别80+种物体类型,包括人物、人脸、动物、车辆和常见物体,准确率达95%+。
    • 智能裁剪算法
    • 智能定位保持主体居中,同时处理大主体或边缘主体等特殊情况。
    • 实时预览
    • 下载前即可通过并排预览查看所有裁剪版本的效果。
    • 手动调整
    • 如果AI建议需要调整,可手动微调裁剪位置。拖拽重新定位、调整裁剪区域大小。

    网站链接

    官网地址:https://aicrop.app