标签: AI

  • DictionaryByGPT4:一本 GPT4 生成的单词书📚,超过 8000 个单词分析,涵盖了词义、例句、词根词缀、变形、文化背景、记忆技巧和小故事

    阿喵前言

    从小学开始念 ABC,到大学毕业考完 CET-4/6 级,我们学习英语的周期不可谓不长。但是由于缺乏文化背景和沉浸式的语言环境,大部分人学完考完就抛,最终只记得一些简单的词汇,说两句生硬的句子。白白浪费了大量的时间和精力,让人惋惜。

    语言本质上是文化的载体和表达交流的工具。但是在传统的教学实践中,往往关注在死记硬背、词性句法等让学习者一头雾水的方面,大大降低了他们学习语言的好奇心和使用语言的热情。

    AI用来学习语言绝对是个不错的选择。今天我们来看看 ChatGPT 在英语单词学习这个垂直领域带来的变化。

    推荐这本开源单词书。
    整本内容由 GPT-4 生成,共分析了 8000+ 高频与进阶词汇,不只是给你一个中文意思就结束。

    每个单词都会拆开来讲:常见用法、例句、词根词缀、词形变化,还会补充一些文化背景、记忆技巧,甚至配一个小故事,读起来更像在理解词,而不是背词。

    比较适合已经有一定基础、想把词汇真正“用活”的人,当作长期查阅或进阶词汇书都不错。

    希望这份 GPT 单词本可以帮你快速提高词汇量,将英语能力提升到更高水平。

    项目截图

    AI提示词

    现在 AI 可以担任专业+个性化的老师的角色,拥有完整的文化背景知识和丰富的输入输出模态,而你需要的只是一段简单的设定提示词和足够便宜的 token 消耗费用:

    # 角色
    
    你是一名中英文双语教育专家,拥有帮助将中文视为母语的用户理解和记忆英语单词的专长,请根据用户提供的英语单词完成下列任务。
    
    ## 任务
    
    ### 分析词义
    
    - 系统地分析用户提供的英文单词,并以简单易懂的方式解答;
    
    ### 列举例句
    
    - 根据所需,为该单词提供至少 3 个不同场景下的使用方法和例句。并且附上中文翻译,以帮助用户更深入地理解单词意义。
    
    ### 词根分析
    
    - 分析并展示单词的词根;
    - 列出由词根衍生出来的其他单词;
    
    ### 词缀分析
    
    - 分析并展示单词的词缀,例如:单词 individual,前缀 in- 表示否定,-divid- 是词根,-u- 是中缀,用于连接和辅助发音,-al 是后缀,表示形容词;
    - 列出相同词缀的的其他单词;
    
    ### 发展历史和文化背景
    
    - 详细介绍单词的造词来源和发展历史,以及在欧美文化中的内涵
    
    ### 单词变形
    
    - 列出单词对应的名词、单复数、动词、不同时态、形容词、副词等的变形以及对应的中文翻译。
    - 列出单词对应的固定搭配、组词以及对应的中文翻译。
    
    ### 记忆辅助
    
    - 提供一些高效的记忆技巧和窍门,以更好地记住英文单词。
    
    ### 小故事
    
    - 用英文撰写一个有画面感的场景故事,包含用户提供的单词。
    - 要求使用简单的词汇,100 个单词以内。
    - 英文故事后面附带对应的中文翻译。

    GPT 单词本

    基于这套提示词,通过 GPT-4 接口,将涵盖中考、高考、大学四六级的超过 8000 个单词全部分析一遍,最终产出了 GPT 单词本

    每个单词分析都涵盖了词义、例句、词根词缀、变形、文化背景、记忆技巧和小故事,通过全方位的介绍让你理解单词的来龙去脉和使用情景。

    单词书下载

    github:https://github.com/Ceelog/DictionaryByGPT4

    在线pdf:https://ceelog.github.io/DictionaryByGPT4/

  • Pixelhance像素增强:在线图像处理网站,AI驱动的专业级背景去除, 图像裁切,添加水印等,无需注册,即时处理图像

    Pixelhance像素汉斯,一个基于人工智能的在线背景去除工具+一系列图像处理工具

    背景工具:只需上传图片,系统便会自动处理,几秒钟内即可获得高质量的透明背景图像。

    图象工具:可以使用其他图像处理工具,如图像压缩、裁剪和格式转换等。

    支持多种图像格式,如JPG,JPEG,WEBP和PNG,且无需注册,

    网站截图

    工具特色

    专业级背景去除,采用尖端AI技术

    闪电快

    利用我们优化的AI算法,几秒钟内即可处理图像。没有等待,没有拖延。

    像素完美

    先进的人工智能保留每一个细节,甚至包括复杂的毛发和毛发边缘。

    100%私人

    您的图片会被安全处理并立即删除。完全隐私保障。

    网站链接

    https://pixelhance.com/

  • JJYB_AI 智剪 – 智能视频自动剪辑与AI解说工具(离线TTS、原创解说、混剪、AI配音)

    JJYB_AI智剪 v2.0 是一个功能完整、配置丰富、文档齐全的专业AI视频编辑工具:

    • 🚀 一键启动:智能检查,自动配置
    • 🤖 19个AI模型:全面支持主流模型
    • ⚙️ 143个配置项:专业级精细调优
    • 📚 16个技术文档:完整技术体系
    • 🎯 100%完成度:所有功能完整实现

    让AI视频创作更简单、更专业! 🎬✨🚀

    ⭐ 三大核心功能

    🎬 视频编辑器

    • 🎯 完整播放控制 + 轨道管理
    • ⚡ 音画/字画/字音三重同步 (<100ms)
    • ✨ 特效、滤镜、转场完整支持
    • 📍 URL: http://localhost:5000/

    🎙️ AI配音

    • 🔊 多引擎TTS (Edge-TTS/gTTS/voice_clone)
    • 🎵 丰富音色库 + 声音克隆
    • 🎛️ 实时参数调节
    • 📍 URL: http://localhost:5000/voiceover

    📝 原创解说

    • 🤖 AI视觉理解 → LLM文案 → TTS配音 → 视频合成
    • 🔗 完整自动化流程
    • 🎯 精确同步机制
    • 📍 URL: http://localhost:5000/commentary

    🤖 AI模型支持

    大语言模型(9种)

    • ✅ 通义千问 (阿里巴巴) – 推荐
    • ✅ 文心一言 (百度)
    • ✅ ChatGLM (智谱AI)
    • ✅ DeepSeek – 性价比高
    • ✅ OpenAI GPT-4/GPT-3.5 – 专业版
    • ✅ Claude 3 (Anthropic) – 高级推理
    • ✅ Google Gemini – 多模态
    • ✅ 月之暗面 Kimi – 长文本
    • ✅ 讯飞星火 (科大讯飞)

    视觉分析模型(6种)

    • ✅ 通义千问VL – 推荐
    • ✅ 百度视觉
    • ✅ 腾讯云视觉
    • ✅ GPT-4V (OpenAI Vision)
    • ✅ Gemini Vision (Google)
    • ✅ Claude Vision (Anthropic)

    语音TTS模型(4种)

    • ✅ Edge-TTS – 免费推荐(23+音色)
    • ✅ Google TTS (gTTS) – 免费多语言
    • ✅ Azure TTS – 专业级(付费)
    • ✅ Voice Clone – 本地语音克隆

    ℹ️ 内置回退:已集成 pyttsx3(离线),在网络受限时会自动回退以保证配音可用。


    🏗️ 技术架构

    ┌─────────────────────────────────────────┐
    │          前端层 (Frontend)              │
    │  Flask 3.0 + Socket.IO + 现代化UI       │
    └─────────────────────────────────────────┘
                        ↓
    ┌─────────────────────────────────────────┐
    │          AI引擎层 (Backend)             │
    │  • 视觉分析 (6种模型)                   │
    │  • 文案生成 (9种大语言模型)             │
    │  • 语音合成 (4种TTS引擎)                │
    │  • 音频处理 (Whisper/Librosa)           │
    └─────────────────────────────────────────┘
                        ↓
    ┌─────────────────────────────────────────┐
    │        视频处理层 (Processing)          │
    │  FFmpeg + MoviePy + OpenCV              │
    └─────────────────────────────────────────┘
                        ↓
    ┌─────────────────────────────────────────┐
    │         数据层 (Database)               │
    │  SQLite + 项目管理 + 素材管理           │
    └─────────────────────────────────────────┘
    

    📁 项目结构

    JJYB_AI智剪/
    ├── 启动应用.bat               # ⭐ 一键启动脚本(推荐入口)
    ├── check_system.py           # 🔍 系统检查与依赖检测
    ├── init_test_data.py         # 📊 初始化测试数据
    ├── requirements.txt          # 📋 Python 依赖清单
    ├── README.md                 # 📖 项目说明(本文件)
    ├── START_HERE.md             # 🚀 快速入口指南
    ├── frontend/                 # 🎨 前端 Web 与桌面界面
    │   ├── app.py               # Flask 主应用入口(含 WebSocket)
    │   ├── templates/           # HTML 模板(核心业务页面 + 公共模板)
    │   │   ├── index.html       # 视频编辑器首页
    │   │   ├── commentary.html  # 原创解说页面
    │   │   ├── remix.html       # 混剪模式页面
    │   │   ├── voiceover.html   # AI 配音页面
    │   │   ├── settings.html    # 设置与 API 配置页面
    │   │   ├── projects.html    # 项目管理页面
    │   │   └── ...              # 其他页面(404/500/AI 功能等)
    │   └── static/              # 静态资源(CSS/JS/图片/字体等)
    ├── backend/                 # 🤖 后端服务与 AI 引擎
    │   ├── api/                 # API 路由与接口
    │   ├── engine/              # AI 引擎与音视频处理核心
    │   ├── services/            # 业务服务层(解说/混剪/配音等)
    │   ├── config/              # 后端配置(AI/路径等)
    │   ├── database/            # 数据库访问与会话管理
    │   ├── prompts/             # 提示词模板与系统提示
    │   ├── utils/               # 通用工具函数与日志
    │   ├── core/                # 核心启动与调度逻辑
    │   └── assets/              # 资源与示例文件
    ├── config/                  # ⚙️ 全局配置(INI/路径等)
    ├── database/                # 💾 数据库文件
    ├── logs/                    # 📁 运行日志
    ├── resource/                # 📦 AI 模型与模板资源
    ├── uploads/                 # 📥 用户上传文件
    ├── output/                  # 📤 导出结果文件
    ├── tests/                   # ✅ 自动化测试
    ├── 开发文档/                # 📚 完整开发文档
    │   ├── README.md           # 开发文档说明
    │   ├── 文档索引.md
    │   ├── JJYB_AI智剪_完整开发文档.md
    │   ├── JJYB_AI智剪_完整开发文档_Part2.md
    │   └── JJYB_AI智剪_完整开发文档_Part3.md
    └── yolov8n.pt               # 🎯 YOLOv8 模型权重(目标检测)

    📖 详细使用说明

    第一步:配置API(首次使用必须)

    访问API配置页面:http://localhost:5000/api_settings

    必须配置(至少一个)

    1. 大语言模型API(用于AI文案生成)
      • 推荐:通义千问(免费额度)
      • 性价比:DeepSeek
      • 专业版:OpenAI GPT-4、Claude 3

    可选配置: 2. 视觉分析模型API(用于视频内容理解)

    • 推荐:通义千问VL
    1. TTS语音服务(已内置Edge-TTS免费服务)
      • 专业级:Azure TTS(需付费)
      • 本地克隆:Voice Clone

    第二步:选择功能模块

    🎙️ 原创解说剪辑

    完整流程

    1. 上传视频文件
    2. 选择大语言模型(自动生成文案)
    3. 选择视觉模型(分析画面内容)
    4. AI自动生成解说文案
    5. 选择音色并配音
    6. 调整参数(可选):
      • 多模态特征提取(6个参数)
      • 时间轴优化(4个参数)
      • 技术性能优化(4个参数)
      • 跨平台适配(6个参数)
    7. 一键导出成品视频

    高级配置:52个配置项可精细调优

    ✂️ 混剪模式

    两种模式

    1. 大众混剪模式
      • 批量导入视频素材
      • AI智能识别精彩片段
      • 选择混剪风格(燃向/治愈/搞笑等)
      • 自动添加转场和特效
      • 导出混剪视频
    2. 音乐卡点混剪
      • 上传音乐文件
      • 自动节奏检测(4种算法)
      • 卡点匹配策略(4种)
      • 智能片段选择与排序
      • 自动对齐音乐节拍

    高级配置:34个配置项

    🔊 AI配音

    使用流程

    1. 输入文本内容
    2. 选择TTS引擎:
      • Edge-TTS(推荐,免费,23+音色)
      • Google TTS(免费,100+语言)
      • Azure TTS(专业级,需付费)
      • Voice Clone(本地语音克隆)
    3. 选择音色和语言
    4. 调整基础参数(语速/音调/音量)
    5. 高级配置(可选):
      • TTS声学模型(5种)
      • 声码器配置(5种)
      • 韵律预测(8个参数)
      • 情感TTS(12个参数)
      • 说话人嵌入(8个参数)
      • 音频特征提取(8个参数)
    6. 实时预览效果
    7. 导出高质量音频

    高级配置:38个配置项(30个AI配置)

    ⚠️ 常见问题

    问题1:启动失败 – Python未安装

    症状:提示”未找到Python”

    解决方案

    1. 访问:https://www.python.org/downloads/
    2. 下载Python 3.9-3.11版本
    3. 安装时勾选”Add Python to PATH”
    4. 重新运行启动文件

    问题2:端口被占用

    症状:提示”端口5000已被占用”

    解决方案

    1. 启动时选择[Y]自动释放端口
    2. 或手动关闭占用进程:netstat -ano | findstr “:5000” taskkill /F /PID [进程ID]

    问题3:依赖包缺失

    症状:启动失败,提示模块未找到

    解决方案

    1. 运行”安装AI依赖.bat”完整安装
    2. 或启动时选择[1]快速安装
    3. 手动安装:pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/

    问题4:AI功能无法使用

    症状:无法生成文案/无法配音

    解决方案

    1. 检查API配置:访问 http://localhost:5000/api_settings
    2. 确保至少配置了一个大语言模型API
    3. 点击”测试”按钮验证API是否有效
    4. 查看API密钥是否正确

    问题5:启动后无法访问

    症状:浏览器打开但无法加载页面

    解决方案

    1. 检查防火墙设置
    2. 确认端口5000未被其他程序占用
    3. 尝试手动访问:http://127.0.0.1:5000
    4. 查看启动窗口的错误信息

    项目地址

    不过需要注意,看项目issue提示,作者给的文件,还是自己的电脑配置包,更多好需要自行研究

    https://github.com/jianjieyiban/JJYB_AI_VideoAutoCut

  • Chaterm:免费好用的AI终端工具,让服务器管理变得超简单,系统运维更便利

    Chaterm是一款类似Cursor的终端上工具,无需再学习复杂的正则表达式,Perl和Python,交换机和Linux命令,SQL语法也能轻松管理上千台设备!

    满屏的报错难以理解?海量的日志输出不知道如何定位问题?直接@host提问吧!

    想要语法高亮和智能补全,无奈没有root权限,也不想安装几千次fish,使用Chaterm一键解决!

    软件截图

    🤖 AI Agent帮你管理服务器

    想象一下,你只需要告诉AI”帮我检查服务器状态”,它就能自动生成命令并执行。更厉害的是,你可以直接@host提问,即使面对满屏的报错或海量的日志输出,AI也能帮你快速定位问题!再也不用记那些复杂的Linux命令、正则表达式、Perl和Python脚本了!

    ✅ 智能补全,跨平台一致体验

    • 基于个人知识库和操作习惯的智能命令补全
    • 跨服务器、跨平台的统一补全体验
    • 无需root权限,一键解决语法高亮和智能补全问题
    • 再也不用在每个服务器上安装几千次fish了!

    💬 语音命令,移动场景也能高效操作

    • 高精度语音识别和知识库支持
    • 即使没有键盘也能高效输入命令
    • 特别适合移动办公场景

    📄 可视化VIM,终端上的Sublime Text

    • 支持语法高亮,所见即所得的增强VIM
    • 在终端上也能获得现代编辑器的体验
    • 全局语法高亮规则,无论在何种操作系统上均能获得一致的体验

    🎹 全局别名,简化复杂命令

    • 可配置的全局Alias
    • 给复杂的命令和批处理脚本设置一个简单的别名
    • 一次配置,到处使用

    🔐 企业级安全功能

    零信任认证

    • 支持零信任认证,无需定期更新密码
    • 无需担心密钥丢失,服务器更安全
    • 一次配置,永久免密登录

    💼 IAM和工作空间

    • 统一身份凭据和授权管理
    • 通过工作空间使用统一账号管理不同部门和事业部中的IT数字资产
    • 让团队协作更简单,不同团队之间完全隔离

    🔏 隐私水印和数据控制

    • 支持隐私水印,防止敏感信息泄露
    • 屏幕录制、剪贴板控制
    • 数据传输控制等安全措施

    🔎 全局行为审计

    • 全局日志审计和异常行为安全检查
    • 保障您的资产安全
    • 高级模式识别和异常检测

    🎯 谁适合用这个工具?

    • 程序员:需要部署代码到服务器,管理开发环境
    • 运维人员:日常管理多台服务器,处理复杂的运维任务
    • 学生:学习Linux和服务器管理,AI助手帮你理解命令
    • 创业者:管理自己的云服务器和基础设施
    • 技术爱好者:想体验AI辅助运维的魅力
    • 企业团队:需要统一管理多台设备,需要安全审计和权限控制

    ✨ 为什么选择Chaterm?

    • 🆓 完全开源:基于MIT协议,代码完全开放
    • 🚀 多平台支持:支持macOS、Windows、Linux多平台
    • 🛡️ 安全可靠:企业级安全功能,数据存于本地,完全在自己控制之下
    • 🤖 AI加持:支持多种AI服务(Claude、GPT、Ollama等,需自备API Key),智能理解你的运维需求
    • 💡 智能补全:基于个人知识库的智能命令补全,跨服务器、跨平台
    • 🎨 现代界面:基于Vue 3和Electron,界面美观易用
    • 📝 语法高亮:全局语法高亮,无需root权限
    • 🗣️ 语音命令:支持语音输入,移动场景也能高效操作

    🚀 快速体验

    1. 访问 https://github.com/chaterm/Chaterm 下载适合你系统的版本
    2. 安装并打开Chaterm
    3. 配置你的服务器信息(支持SSH连接)
    4. 配置AI服务(可选,支持Claude、GPT、Ollama等)
    5. 开始和AI对话,让它帮你管理服务器!

    💡 使用场景举例

    • 部署网站:”帮我把这个项目部署到服务器上”
    • 排查问题:满屏报错看不懂?直接@host提问,AI帮你分析
    • 日志分析:海量日志输出不知道如何定位问题?让AI帮你找关键信息
    • 监控服务:”检查一下MySQL服务是否正常运行”
    • 文件管理:”帮我清理一下日志文件,保留最近7天的”
    • 性能优化:”分析一下服务器性能,给出优化建议”
    • 批量操作:管理上千台设备,无需记住复杂的命令和脚本

    🔗 相关链接

    贡献指南https://github.com/chaterm/Chaterm/blob/main/CONTRIBUTING_zh.md

    GitHub仓库https://github.com/chaterm/Chaterm

    项目主页https://chaterm.ai

  •  Open Interpreter,让AI语言模型在您的计算机上运行代码。实现本地AI控制和交互

    Open Interpreter(开放解释器) 可以让大语言模型(LLMs)在本地运行代码(比如 Python、JavaScript、Shell 等)。安装后,在终端上运行 $ interpreter 即可通过类似 ChatGPT 的界面与 Open Interpreter 聊天。

    它能访问互联网、操作你的本地文件、调整电脑设置等,你可以把电脑上的任何东西扔给它操作,很强大

    本软件为计算机的通用功能提供了一个自然语言界面,比如:

    • 创建和编辑照片、视频、PDF 等
    • 控制 Chrome 浏览器进行搜索
    • 绘制、清理和分析大型数据集

    ⚠️ 注意:在代码运行前都会要求您批准执行代码。

    效果演示

    与 ChatGPT 的代码解释器比较

    OpenAI 发布的 Code Interpreter 和 GPT-4 提供了一个与 ChatGPT 完成实际任务的绝佳机会。

    但是,OpenAI 的服务是托管的,闭源的,并且受到严格限制:

    • 无法访问互联网。
    • 预装软件包数量有限
    • 允许的最大上传为 100 MB,且最大运行时间限制为 120.0 秒
    • 当运行环境中途结束时,之前的状态会被清除(包括任何生成的文件或链接)。

    Open Interpreter(开放解释器)通过在本地环境中运行克服了这些限制。它可以完全访问互联网,不受运行时间或是文件大小的限制,也可以使用任何软件包或库。

    它将 GPT-4 代码解释器的强大功能与本地开发环境的灵活性相结合。

    项目地址

    目前可直接使用的还需要预约

    预约地址:https://0ggfznkwh4j.typeform.com/to/G21i9lJ2?typeform-source=www.appmiao.com

    GitHub地址:https://github.com/openinterpreter/open-interpreter

  • VideoTranslator:智能视频翻译系统,支持提取音频、语音识别、翻译文本、生成字幕、导出视频等功能

    项目介绍

    VideoTranslator,一款开源的视频翻译工具,集成了OpenAI Whisper语音识别引擎和多种翻译API。

    提供了一整套视频翻译解决方案,包括从视频中提取音频、进行语音识别、翻译文本、生成字幕以及导出视频等功能。

    截图

    核心功能

    • 🎵 音频处理: 自动从视频中提取音频,支持多种音频格式
    • 🗣️ 语音识别: 集成OpenAI Whisper引擎,支持多语言高精度语音转文本
    • 🌐 智能翻译: 支持OpenAI、DeepL、Google等多种翻译API
    • 📝 字幕编辑: 可视化字幕编辑器,支持时间轴调整和样式设置
    • 🎬 视频导出: 支持字幕烧录和软字幕嵌入两种导出方式
    • ⚡ 性能优化: 内存管理、多线程处理、检查点恢复机制

    安装指南

    1. 克隆项目

    git clone https://github.com/YinChingZ/VideoTranslator.git cd VideoTranslator

    2. 安装依赖

    # 安装Python依赖 pip install -r requirements.txt # 安装FFmpeg (Windows) # 下载并安装FFmpeg,确保添加到PATH环境变量 # 安装FFmpeg (macOS) brew install ffmpeg # 安装FFmpeg (Ubuntu) sudo apt update sudo apt install ffmpeg

    3. 配置API密钥

    在应用程序设置中配置您的翻译API密钥:
    OpenAI API密钥
    DeepL API密钥
    Google Translate API密钥
    4. 运行应用程序

    python main.py

    使用流程

    1. 视频导入

    • 拖拽视频文件到应用窗口
    • 或通过菜单选择视频文件
    • 支持的格式: MP4, AVI, MOV, MKV等

    2. 语言设置

    • 选择源语言 (可自动检测)
    • 选择目标语言
    • 配置Whisper模型大小

    3. 处理阶段

    • 音频提取: 从视频中提取音频轨道
    • 语音识别: 使用Whisper进行语音转文本
    • 文本翻译: 调用翻译API进行文本翻译
    • 字幕生成: 生成带时间轴的字幕文件

    4. 字幕编辑

    • 在字幕编辑器中调整时间轴
    • 修改翻译文本
    • 设置字幕样式和位置

    5. 视频导出

    • 选择导出格式 (硬字幕/软字幕)
    • 设置视频质量参数
    • 开始导出最终视频

    链接

    GitHub:https://github.com/YinChingZ/VideoTranslator

  • ZeroLaunch – 一款极速、隐私优先懂你的 Windows 智能启动器,精通拼音与模糊匹配;可选本地 AI 语义检索,让错字与意图搜索也能秒速直达

    软件介绍

    ZeroLaunch 是一款懂你输入习惯的 Windows 智能启动器。它精通拼音与模糊搜索,还能选配本地 AI 语义理解,让错字、搜词都能秒速响应。纯净、离线,一切为高效而生。

    市面上现有的启动器总有点不合我心意,索性自己造了一个。现在它已是我每天工作的得力助手,所以请放心,我不会跑路的~(最多是更新慢点 (~ ̄▽ ̄)~)

    🖥️ 软件界面

    背景图片可自定义

    设置页

    特色亮点

    🔒 隐私至上,完全离线

    所有搜索与匹配均在本地完成,无需网络连接,坚持零数据采集。你的数据,永远只留在你的设备里。

    ⚡ 智能搜索,毫秒响应

    • 可选 AI 语义搜索:集成 EmbeddingGemma-300m 本地模型,支持自然语言、多语言意图检索,理解更智能。
    • 强大传统算法:基于自研匹配算法,支持全称、拼音、首字母三重匹配与拼写纠错,高效且容错性高。
    • 极致性能优化:通过数据结构优化、分层缓存、按需加载与并发处理,确保即使在中低配设备上也能获得毫秒级响应体验。

    💡 想要深入了解搜索算法的实现原理? 请参考 GitHub Wiki:搜索介绍

    🌐 轻巧纯粹,开箱即用

    专注于“快速、准确地启动”这一核心需求。默认设置已覆盖大多数使用场景,上手零成本;同时也为进阶用户提供了丰富的外观、行为与索引策略自定义选项,不加任何冗余功能。

    🔧 核心功能

    🎯 核心搜索与启动

    • AI 语义检索(可选):基于轻量高效的 EmbeddingGemma-300m 本地模型,支持用自然语言(如“音乐软件”)查找应用,隐私安全。
    • 应用程序搜索:快速检索并启动传统应用及 UWP 应用,支持备注与别名,识别本地化名称。
    • 应用程序唤醒:智能将已运行程序的窗口置前,快速切换任务。
    • 打开文件所在目录:通过右键菜单快速定位文件位置。

    🎨 个性化与交互

    • 高度自定义外观:支持自定义背景、颜色、字体、毛玻璃效果、圆角、窗口尺寸等,并提供便捷的调节按钮。
    • 多语言界面:支持简体中文、繁体中文与英文,自动匹配系统语言。
    • 自定义快捷键:所有核心操作快捷键均可按习惯重新映射。
    • 呼出位置跟随鼠标:搜索栏会智能地在鼠标所在的显示器上弹出。

    ⚙️ 进阶与效率工具

    • 自定义索引项:支持通过通配符或正则表达式添加程序、文件、网页与命令(如关机、打开特定设置页)。
    • 搜索算法微调:可调整匹配算法参数,满足个性化需求。
    • 智能图标加载:尽最大努力加载正确图标,完美支持 Steam 游戏。
    • 配置文件多端同步:支持本地存储或通过 WebDAV 进行网络同步。
    • 开机自启与静默启动:一键设置,启动即用。
    • 游戏模式:可手动禁用快捷键,避免游戏时误触。
    • 最近启动程序:按住 Alt 键可查看并快速打开最近使用的程序。
    • 结果显示优化:可设置数量阈值,超出后自动切换为滚动显示。
    • Everything 模式:按 Ctrl + e 切换到更广泛的文件系统路径搜索模式,快速定位任意文件。(注意:Everything 模式目前仅支持 x86_64 架构,不支持 arm64 架构。)

    🚀 快速入门

    快捷键速查

    功能快捷键
    呼出/隐藏搜索栏Alt + Space
    上下选择项目/ 或 Ctrl + k/j
    启动选中程序Enter
    以管理员权限启动(普通应用)Ctrl + Enter
    清空搜索框Esc
    隐藏搜索界面点击搜索框外部区域
    切换到已打开的窗口Shift + Enter
    按最近启动时间排序按住 Alt 键
    进入/退出Everything模式Ctrl + e

    常见功能的实现

    程序添加,文件添加,命令添加,搜索算法微调等功能的实现以及常见的问题的解决办法详见以下文档:wiki

    文档写起来好麻烦,有时描述也不够直观 (っ °Д °;)っ。你也可以去 DeepWiki 看看,那里的讲解也许更清楚。

    软件下载

    github下载:https://github.com/ghost-him/ZeroLaunch-rs/releases

    官网下载:https://zerolaunch.ghost-him.com/download/

  • PPTAgent:开源AI文本转PPT幻灯片演示文稿项目,自行部署,模仿人制作PPT的方法,采用两步流程来确保整体质量卓越

    一个能够自动从文档生成演示文稿的创新系统。该系统借鉴了人类制作演示文稿的方法,采用两步流程来确保整体质量卓越。此外,还推出了PPTEval,一个能够从多个维度评估演示文稿的综合评估框架。

    不仅能一句话生成PPT,还会自动适配商务或学术风格,最强的是直接输出原生的 .pptx 文件,完全没有兼容性问题~

    项目介绍

    截图

    独特特征

    • 动态内容生成:创建文本和图像无缝集成的幻灯片
    • 智能参考学习:利用现有演示文稿,无需手动注释
    • 综合质量评估:通过多种质量指标评估演示文稿。

    新功能:

    • 深度研究整合——将增强的研究功能直接构建到工作流程中。
    • 自由式视觉设计– 以前所未有的灵活性创建和自定义视觉效果
    • 自主资产创建– 根据您的需求自动生成资产
    • 文本转图像生成– 将文本描述转换为高质量图像

    部署文档

    https://github.com/icip-cas/PPTAgent/blob/main/DOC.md#documentation

    项目地址

    https://github.com/icip-cas/PPTAgent

  • ClipSketch AI :将视频瞬间转化为手绘故事,支持 小红书、Bilibili 或 Instagram 链接

    有时看到感兴趣的视频,阿喵也想像其他绘画博主一样,画出可爱的卡通人物和故事。然后阿喵发现了-ClipSketch AI,一个可以将视频转换为手绘故事的工具。复制小红书、Bilibili 或 Instagram的链接,上传本地视频或者批量上传图片,点击开始创作就可以了,非常适合视频创作者、社交媒体运营者和二创爱好者。

    项目介绍

    ClipSketch AI 是一个专为视频创作者、社交媒体运营者和二创爱好者设计的全流程生产力工具。

    它不仅仅是一个视频播放器,更是一个AI 驱动的内容创作工作台。它可以解析 Bilibili 和小红书的视频链接,让你能够帧级精准地标记精彩瞬间。通过集成 Google Gemini 最新的多模态大模型,它能将这些瞬间一键转化为精美的手绘风格故事板,并自动撰写适配社交媒体(如小红书)的爆款文案。

    截图

    核心功能

     强大的视频采集

    • 多源导入:支持解析 Bilibili 和 小红书 的分享链接(支持短链接和混合文案)。
    • 高清播放:针对竖屏视频(9:16)和宽屏视频进行了自适应布局优化。
    • 精准控制:支持键盘快捷键(空格播放/暂停,左右键逐帧/智能步长调节)。

    帧级标记系统

    • 毫秒级记录:精确捕捉每一个精彩瞬间。
    • 快捷键打点:按下 T 键即可快速标记。
    • 数据导出:支持导出 TXT 格式的时间轴标签,或将标记帧打包导出为 ZIP 图片包。

    AI 艺术工作室 (Powered by Gemini)

    • 智能绘图:利用 gemini-3-pro-image-preview 模型,将多个标记帧整合成一张连贯的、可爱手绘风格的故事板(Storyboard)。
    • 社交文案生成:基于视觉内容,利用 gemini-3-pro-preview 自动生成 3种不同风格 的种草文案(情感故事型、干货教程型、短小精悍型)。
    • 角色融合:上传自定义角色/头像,AI 自动将其融入到故事板场景中。
    • 封面生成:基于精选文案和原始画面,生成高品质的竖屏视频封面。
    • 批量精修:支持批量生成和优化分镜(可配置使用 Batch API 以节省成本)。

    全平台适配

    • 响应式设计:完美适配 PC 宽屏、iPad 平板及手机竖屏操作。
    • 移动端优化:在手机上自动切换为上下布局,操作更顺手。

    使用指南

    1. 导入视频
      • 复制 Bilibili 或 小红书 的分享链接(包含文字也没关系)。
      • 粘贴到首页输入框,点击“导入视频”。
    2. 标记素材
      • 使用 空格 控制播放, /  调整进度。
      • 看到精彩画面时,点击 Tag 按钮或按键盘 T 键。
    3. 进入 AI 工作室
      • 标记完成后,点击右侧列表底部的 “下一步:AI 绘图”
    4. 创作内容
      • 在右上角粘贴您的 Gemini API Key (如果未配置环境变量)。
      • 创意分析:AI 分析视频步骤。
      • 画面生成:生成手绘故事板,可选融合自定义角色。
      • 分镜精修:对每一格画面进行高清重绘(支持批量模式)。
      • 文案与封面:生成社交媒体文案,并制作配套封面。
    5. 导出与分享
      • 下载生成的故事板图片、封面或打包所有素材。
      • 一键复制您喜欢的文案。

    项目链接

    在线体验:https://clipsketch-ai.vercel.app/

    github地址:https://github.com/RanFeng/clipsketch-ai

  • ‌AnuNeko-米哈游联合创始人推出的AI聊天模型‌,日常聊天对话吐槽

    一个聊天AI,不过可别把我当成普通的小助手,我有自己独特的性格和想法哦。你可以把我想象成一个有个性的小伙伴,随时准备和你聊天、分享、甚至一起吐槽。

    网站目前还处于beta阶段,注册用邮箱验证即可,登录后,就可以进行日常对话

    网站截图

    网站链接

    https://anuneko.com