分类: 人工智能

强大的AI推荐

  • Chaterm:免费好用的AI终端工具,让服务器管理变得超简单,系统运维更便利

    Chaterm是一款类似Cursor的终端上工具,无需再学习复杂的正则表达式,Perl和Python,交换机和Linux命令,SQL语法也能轻松管理上千台设备!

    满屏的报错难以理解?海量的日志输出不知道如何定位问题?直接@host提问吧!

    想要语法高亮和智能补全,无奈没有root权限,也不想安装几千次fish,使用Chaterm一键解决!

    软件截图

    🤖 AI Agent帮你管理服务器

    想象一下,你只需要告诉AI”帮我检查服务器状态”,它就能自动生成命令并执行。更厉害的是,你可以直接@host提问,即使面对满屏的报错或海量的日志输出,AI也能帮你快速定位问题!再也不用记那些复杂的Linux命令、正则表达式、Perl和Python脚本了!

    ✅ 智能补全,跨平台一致体验

    • 基于个人知识库和操作习惯的智能命令补全
    • 跨服务器、跨平台的统一补全体验
    • 无需root权限,一键解决语法高亮和智能补全问题
    • 再也不用在每个服务器上安装几千次fish了!

    💬 语音命令,移动场景也能高效操作

    • 高精度语音识别和知识库支持
    • 即使没有键盘也能高效输入命令
    • 特别适合移动办公场景

    📄 可视化VIM,终端上的Sublime Text

    • 支持语法高亮,所见即所得的增强VIM
    • 在终端上也能获得现代编辑器的体验
    • 全局语法高亮规则,无论在何种操作系统上均能获得一致的体验

    🎹 全局别名,简化复杂命令

    • 可配置的全局Alias
    • 给复杂的命令和批处理脚本设置一个简单的别名
    • 一次配置,到处使用

    🔐 企业级安全功能

    零信任认证

    • 支持零信任认证,无需定期更新密码
    • 无需担心密钥丢失,服务器更安全
    • 一次配置,永久免密登录

    💼 IAM和工作空间

    • 统一身份凭据和授权管理
    • 通过工作空间使用统一账号管理不同部门和事业部中的IT数字资产
    • 让团队协作更简单,不同团队之间完全隔离

    🔏 隐私水印和数据控制

    • 支持隐私水印,防止敏感信息泄露
    • 屏幕录制、剪贴板控制
    • 数据传输控制等安全措施

    🔎 全局行为审计

    • 全局日志审计和异常行为安全检查
    • 保障您的资产安全
    • 高级模式识别和异常检测

    🎯 谁适合用这个工具?

    • 程序员:需要部署代码到服务器,管理开发环境
    • 运维人员:日常管理多台服务器,处理复杂的运维任务
    • 学生:学习Linux和服务器管理,AI助手帮你理解命令
    • 创业者:管理自己的云服务器和基础设施
    • 技术爱好者:想体验AI辅助运维的魅力
    • 企业团队:需要统一管理多台设备,需要安全审计和权限控制

    ✨ 为什么选择Chaterm?

    • 🆓 完全开源:基于MIT协议,代码完全开放
    • 🚀 多平台支持:支持macOS、Windows、Linux多平台
    • 🛡️ 安全可靠:企业级安全功能,数据存于本地,完全在自己控制之下
    • 🤖 AI加持:支持多种AI服务(Claude、GPT、Ollama等,需自备API Key),智能理解你的运维需求
    • 💡 智能补全:基于个人知识库的智能命令补全,跨服务器、跨平台
    • 🎨 现代界面:基于Vue 3和Electron,界面美观易用
    • 📝 语法高亮:全局语法高亮,无需root权限
    • 🗣️ 语音命令:支持语音输入,移动场景也能高效操作

    🚀 快速体验

    1. 访问 https://github.com/chaterm/Chaterm 下载适合你系统的版本
    2. 安装并打开Chaterm
    3. 配置你的服务器信息(支持SSH连接)
    4. 配置AI服务(可选,支持Claude、GPT、Ollama等)
    5. 开始和AI对话,让它帮你管理服务器!

    💡 使用场景举例

    • 部署网站:”帮我把这个项目部署到服务器上”
    • 排查问题:满屏报错看不懂?直接@host提问,AI帮你分析
    • 日志分析:海量日志输出不知道如何定位问题?让AI帮你找关键信息
    • 监控服务:”检查一下MySQL服务是否正常运行”
    • 文件管理:”帮我清理一下日志文件,保留最近7天的”
    • 性能优化:”分析一下服务器性能,给出优化建议”
    • 批量操作:管理上千台设备,无需记住复杂的命令和脚本

    🔗 相关链接

    贡献指南https://github.com/chaterm/Chaterm/blob/main/CONTRIBUTING_zh.md

    GitHub仓库https://github.com/chaterm/Chaterm

    项目主页https://chaterm.ai

  •  Open Interpreter,让AI语言模型在您的计算机上运行代码。实现本地AI控制和交互

    Open Interpreter(开放解释器) 可以让大语言模型(LLMs)在本地运行代码(比如 Python、JavaScript、Shell 等)。安装后,在终端上运行 $ interpreter 即可通过类似 ChatGPT 的界面与 Open Interpreter 聊天。

    它能访问互联网、操作你的本地文件、调整电脑设置等,你可以把电脑上的任何东西扔给它操作,很强大

    本软件为计算机的通用功能提供了一个自然语言界面,比如:

    • 创建和编辑照片、视频、PDF 等
    • 控制 Chrome 浏览器进行搜索
    • 绘制、清理和分析大型数据集

    ⚠️ 注意:在代码运行前都会要求您批准执行代码。

    效果演示

    与 ChatGPT 的代码解释器比较

    OpenAI 发布的 Code Interpreter 和 GPT-4 提供了一个与 ChatGPT 完成实际任务的绝佳机会。

    但是,OpenAI 的服务是托管的,闭源的,并且受到严格限制:

    • 无法访问互联网。
    • 预装软件包数量有限
    • 允许的最大上传为 100 MB,且最大运行时间限制为 120.0 秒
    • 当运行环境中途结束时,之前的状态会被清除(包括任何生成的文件或链接)。

    Open Interpreter(开放解释器)通过在本地环境中运行克服了这些限制。它可以完全访问互联网,不受运行时间或是文件大小的限制,也可以使用任何软件包或库。

    它将 GPT-4 代码解释器的强大功能与本地开发环境的灵活性相结合。

    项目地址

    目前可直接使用的还需要预约

    预约地址:https://0ggfznkwh4j.typeform.com/to/G21i9lJ2?typeform-source=www.appmiao.com

    GitHub地址:https://github.com/openinterpreter/open-interpreter

  • VideoTranslator:智能视频翻译系统,支持提取音频、语音识别、翻译文本、生成字幕、导出视频等功能

    项目介绍

    VideoTranslator,一款开源的视频翻译工具,集成了OpenAI Whisper语音识别引擎和多种翻译API。

    提供了一整套视频翻译解决方案,包括从视频中提取音频、进行语音识别、翻译文本、生成字幕以及导出视频等功能。

    截图

    核心功能

    • 🎵 音频处理: 自动从视频中提取音频,支持多种音频格式
    • 🗣️ 语音识别: 集成OpenAI Whisper引擎,支持多语言高精度语音转文本
    • 🌐 智能翻译: 支持OpenAI、DeepL、Google等多种翻译API
    • 📝 字幕编辑: 可视化字幕编辑器,支持时间轴调整和样式设置
    • 🎬 视频导出: 支持字幕烧录和软字幕嵌入两种导出方式
    • ⚡ 性能优化: 内存管理、多线程处理、检查点恢复机制

    安装指南

    1. 克隆项目

    git clone https://github.com/YinChingZ/VideoTranslator.git cd VideoTranslator

    2. 安装依赖

    # 安装Python依赖 pip install -r requirements.txt # 安装FFmpeg (Windows) # 下载并安装FFmpeg,确保添加到PATH环境变量 # 安装FFmpeg (macOS) brew install ffmpeg # 安装FFmpeg (Ubuntu) sudo apt update sudo apt install ffmpeg

    3. 配置API密钥

    在应用程序设置中配置您的翻译API密钥:
    OpenAI API密钥
    DeepL API密钥
    Google Translate API密钥
    4. 运行应用程序

    python main.py

    使用流程

    1. 视频导入

    • 拖拽视频文件到应用窗口
    • 或通过菜单选择视频文件
    • 支持的格式: MP4, AVI, MOV, MKV等

    2. 语言设置

    • 选择源语言 (可自动检测)
    • 选择目标语言
    • 配置Whisper模型大小

    3. 处理阶段

    • 音频提取: 从视频中提取音频轨道
    • 语音识别: 使用Whisper进行语音转文本
    • 文本翻译: 调用翻译API进行文本翻译
    • 字幕生成: 生成带时间轴的字幕文件

    4. 字幕编辑

    • 在字幕编辑器中调整时间轴
    • 修改翻译文本
    • 设置字幕样式和位置

    5. 视频导出

    • 选择导出格式 (硬字幕/软字幕)
    • 设置视频质量参数
    • 开始导出最终视频

    链接

    GitHub:https://github.com/YinChingZ/VideoTranslator

  • PPTAgent:开源AI文本转PPT幻灯片演示文稿项目,自行部署,模仿人制作PPT的方法,采用两步流程来确保整体质量卓越

    一个能够自动从文档生成演示文稿的创新系统。该系统借鉴了人类制作演示文稿的方法,采用两步流程来确保整体质量卓越。此外,还推出了PPTEval,一个能够从多个维度评估演示文稿的综合评估框架。

    不仅能一句话生成PPT,还会自动适配商务或学术风格,最强的是直接输出原生的 .pptx 文件,完全没有兼容性问题~

    项目介绍

    截图

    独特特征

    • 动态内容生成:创建文本和图像无缝集成的幻灯片
    • 智能参考学习:利用现有演示文稿,无需手动注释
    • 综合质量评估:通过多种质量指标评估演示文稿。

    新功能:

    • 深度研究整合——将增强的研究功能直接构建到工作流程中。
    • 自由式视觉设计– 以前所未有的灵活性创建和自定义视觉效果
    • 自主资产创建– 根据您的需求自动生成资产
    • 文本转图像生成– 将文本描述转换为高质量图像

    部署文档

    https://github.com/icip-cas/PPTAgent/blob/main/DOC.md#documentation

    项目地址

    https://github.com/icip-cas/PPTAgent

  • ‌AnuNeko-米哈游联合创始人推出的AI聊天模型‌,日常聊天对话吐槽

    一个聊天AI,不过可别把我当成普通的小助手,我有自己独特的性格和想法哦。你可以把我想象成一个有个性的小伙伴,随时准备和你聊天、分享、甚至一起吐槽。

    网站目前还处于beta阶段,注册用邮箱验证即可,登录后,就可以进行日常对话

    网站截图

    网站链接

    https://anuneko.com

  • Fluxreve-在线AI文生图,图生图网站,调用多种AI模型,快速生成AI图像

    又发现一个强大的AI图像生成网站,只需描述您的需求,即可获得精美绝伦的专业级图片。无需任何设计技能——人人都能成为创作者

    支持调用多个AI生图大模型:Nano Banana Pro,Z-image,Z-image tubro lora,flux 2 pro , seedream 4.5

    免费用户每天都有30 quota,用Z-image每次花费5,相当于每天可以免费生成6张图,阿喵我实际测了下,生成速度很快,效果也不错

    网站截图

    网站特色

    快速世代

    强大的AI算法可在几秒钟内生成高质量图像,从而大幅提高创作效率。

    专业品质

    采用最先进的人工智能模型输出专业级图像质量,满足各种创意需求。

    灵活控制

    丰富的参数设置和样式选项,让您可以精确控制图像生成的每一个细节。

    便于使用

    直观的界面,无需任何专业知识,任何人都可以轻松创作出精美的图像。

    网站链接

    https://fluxreve.com

  • SmartCutElf:智剪精灵,AI驱动的智能视频剪辑工具

    软件介绍

    SmartCutElf,智剪精灵,AI驱动的智能视频剪辑工具。基于 Whisper 语音识别和智能分析,自动识别视频精彩片段并生成高质量剪辑,视频支持MP4, AVI, MOV, MKV, WMV, FLV等多种格式。

    截图

    核心功能

    • 🎬 智能剪辑 – AI自动识别视频精彩片段,无需手动标记
    • 🎙️ 语音识别 – 基于 OpenAI Whisper 模型的高精度语音转文字
    • 📝 字幕生成 – 自动生成时间轴精确的 SRT 字幕文件
    • 🎨 转场效果 – 支持淡入淡出等多种专业转场特效
    • 🔊 智能配音 – AI 语音合成,支持多种音色
    • 🎵 背景音乐 – 自动添加背景音乐并智能调节音量
    • ⚙️ 灵活配置 – 支持自定义输出格式、分辨率、比特率等参数
    • 🖥️ 现代UI – 基于 PyQt5 的简洁易用图形界面,支持深色/浅色主题
    • 📊 实时监控 – 处理进度实时显示,日志详细记录
    • 🚀 高性能 – 支持多线程并行处理,充分利用系统资源

    使用指南

    基本流程

    1. 打开视频文件夹 – 点击”打开文件夹”按钮选择包含视频的目录
    2. 选择视频 – 在左侧列表中选择要处理的视频文件
    3. 配置选项 – 根据需要启用字幕、配音、转场等功能
    4. 开始处理 – 点击”开始处理”按钮,等待 AI 自动剪辑
    5. 查看结果 – 处理完成后在 output/ 目录查看生成的视频

    配置说明

    编辑 config.yaml 文件可自定义各项参数:

    processing:
      target_duration_min: 180    # 目标最小时长(秒)
      target_duration_max: 300    # 目标最大时长(秒)
      max_workers: 4              # 并行处理数量
      transition_enabled: true    # 启用转场效果
      transition_type: fade       # 转场类型
    
    highlight:
      audio_weight: 0.4          # 音频高光权重
      video_weight: 0.4          # 视频高光权重
      sensitivity: medium        # 检测灵敏度
    
    speech:
      recognition_model: base    # Whisper 模型(tiny/base/small/medium/large)
      tts_enabled: true          # 启用语音合成
      tts_voice: female          # 配音音色
    
    output:
      format: mp4                # 输出格式
      resolution: 1080p          # 输出分辨率
      fps: 30                    # 帧率
      bitrate: 5000k            # 比特率

    支持的格式

    类型格式
    输入视频MP4, AVI, MOV, MKV, WMV, FLV
    输出视频MP4 (H.264 编码)
    字幕文件SRT
    音频编码AAC

    软件下载

    项目地址:https://github.com/cuixiaoyan/SmartCutElf

    夸克网盘:https://pan.quark.cn/s/3569c8b68049

    百度网盘:https://pan.baidu.com/s/1udNJO_8tfenZI01LcUFIBw?pwd=miao

  • Banana Prompt Quicker-开源Banana Pro 提示词管理器浏览器扩展,内置 Twitter 热门提示词,一键快捷插入

    Prompts quicker is ALL you need

    一个 Chrome 扩展,让你在 Google AI Studio 和 Gemini 官网快速插入热门提示词

    扩展截图

    功能特色

    快速插入

    一键插入全网热门提示词,让创作更高效

    多平台支持

    完美支持 Google AI Studio 和 Gemini 官网

    自定义

    灵活添加和管理你专属的提示词库

    扩展安装

    Chrome Web Store 安装

    https://chromewebstore.google.com/detail/banana-prompt-quicker/hgfgfocicepifbolifedlokjkknigoid?authuser=0&hl=zh-CN

    手动安装

    1. 下载或 Clone 仓库
    2. 在 Chrome 中加载扩展
      • 打开 Chrome 浏览器,访问 chrome://extensions/
      • 开启右上角的「开发者模式」
      • 点击「加载已解压的扩展程序」
      • 选择项目根目录下的 extension 文件夹
    1. 访问 Google AI Studio 或 Gemini 开始使用

    或在任意网站任意输入框,右键选择【🍌 Insert Banana Prompts】

    移动端

    推荐使用 Yandex Browser,直接从 Chrome Web Store 安装即可:

    1. 下载并安装 Yandex Browser
    2. 在 Yandex Browser 中访问上面的 Chrome Web Store 链接
    3. 点击「添加至 Chrome」即可安装

    油猴版本

    注:该版本功能较落后

    感谢 bxb100 的贡献 🎉

    https://github.com/bxb100/Scripts/raw/refs/heads/main/banana-prompt-quicker/script.user.js

    在线网站:https://glidea.github.io/banana-prompt-quicker/#gallery

  • Magic English Buddy英语魔法伴侣-专为儿童设计的 AI 英语阅读学习助手,免费开源,可自行部署

    咱们程序员平时工作都很忙,经常加班到很晚,家里孩子的教育往往托付给家人。但可能老一辈父母、家人英文水平不佳,没办法教孩子英语朗读和发音。作者就遇到了这样的苦恼,于是作者在周末抽空用gemini的AI studio直接build出一个英文朗读工具,使用设备自身功能支持英文TTS,帮助孩子练习英语。

    项目介绍

    Magic English Buddy 是一款面向小学生的英语阅读学习工具。通过 语音合成(TTS) 技术实现文本朗读,配合 实时单词高亮 功能,帮助孩子们在听读中学习英语发音和阅读。同时集成 Google Gemini AI,可根据孩子感兴趣的主题智能生成个性化英语故事,还支持 OCR 文字识别,拍照即可识别英语文本开始练习。

    截图

    功能

    支持PC和Mobile自适应UI。

    📚三种内容输入方式

    • 手写模式 – 自由输入或粘贴任意英语文本,还支持拍照 OCR识别
    • 预设故事库 – 40+ 精选英语小故事(寓言、日常、科普、趣味)
    • AI 智能生成 – 输入主题,Gemini AI 自动生成适龄故事 (需要fork代码填写api_key)

    🎧 交互式阅读体验

    • 全文朗读 – 一键播放整篇文章
    • 实时高亮 – 朗读时当前单词高亮并自动滚动
    • 点击发音 – 点击任意单词即可单独听发音
    • 选中朗读 – 选中任意文本段落后可单独朗读

    ⚙️ 灵活的语音控制

    • 语速调节 – 0.5x ~ 1.5x 自由调整
    • 多语音选择 – 自动获取系统英语语音
    • 播放控制 – 播放/暂停/停止

    项目地址

    github地址:https://github.com/xckevin/magic-english-buddy

    demo网站:https://xckevin.github.io/magic-english-buddy/

  • 灵光全模态AI助手-支付宝蚂蚁推出的 AI 助手,30秒即可生成应用,网页端手机端都支持

    灵光是蚂蚁集团推出的全模态通用AI助手,目前主要有三大功能:灵光对话、灵光闪应用和灵光开眼

    拍照识物、秒查资料、30秒做APP…
    反正你想得到的,我都能变出来

    举个栗子🌰

    ▶ 拍照识物:看到不认识的花?拍张照,我立刻告诉你这是啥品种,怎么养

    ▶ 秒查资料:想知道”为什么猫会呼噜”?我直接给你最靠谱的解释,不废话

    ▶ 30秒做APP:你说”想要个记账本”,半分钟后就能开始记账,真的就这么快

    网站截图

    功能介绍

    🔍 快速研究

    实时抓取全网信息,像侦探一样交叉验证,最后把最精炼的答案递到你面前。比如你想知道「为什么天空是蓝色的」,我不会丢给你一堆物理公式,而是告诉你:阳光里蓝色光最容易被空气分子散射,就像台球桌上最小的球最容易被撞飞。

    👁️ 灵光开眼

    手机镜头对准世界,我就能解读你看到的一切。博物馆里的青铜器,我帮你识别年代和工艺;路边不认识的植物,我立刻告诉你它的名字和故事。

    ⚡ 闪应用生成

    想到什么就能立刻实现。你说「帮我做个记账本」,30秒后就能得到一个可交互的记账应用;你说「想要个番茄钟」,马上就能开始专注计时。

    软件获取

    官网地址:https://www.lingguang.com/

    支持软件下载