博客

  • 烟花工坊:在线互动烟花模拟器,完全免费,无需登录

    网站介绍

    烟花工坊,一个可以在线预览烟花效果的网站。可自定义文字和颜色效果,涵盖22种不同特色的主题,且可调节烟花自动燃放还是手动燃放,体验不同的效果。

    网站完全免费,无需登录。直接在线体验,娱乐一下。

    截图

    网站链接

    https://yanhua.aitool.cfd

  • AIART PICS:AI 图像生成提示词灵感库,全网最大的 Nano Banana 提示词库!汇聚 900+ 位全球创作者的3200+ 精选案例

    网站介绍

    AIART PICS:AI 图像生成提示词网站,精选 3000+ Gemini、ChatGPT、Midjourney、Stable Diffusion 提示词。涵盖摄影、插画、3D 渲染、UI 设计、创意海报等 20+ 个专业领域,全方位展示 Google 图像生成模型的无限可能。每个案例都经过人工筛选,确保质量和实用性。

    点击案例即可复制提示词使用。

    截图

    特色

    • 🏆 规模最大 – 3200+ 提示词,900+ 位创作者,持续增长
    • ✅ 质量保证 – 所有案例都是真实生成结果,附带原图展示
    • 🎯 即用即学 – 每个提示词都可直接复制使用,快速上手
    • � 每日更新 – 自动化收集最新优质案例,保持时效性
    • � 双语支持 – 中英文双语界面,服务全球用户
    • 🔗 完整溯源 – 每个案例都附带原始来源,尊重创作者

    获取链接

    网站地址:https://aiart.pics/

    项目地址:https://github.com/Jermic/awesome-aiart-pics-prompts

  • YouMedHub:一个基于 AI的视频分析、剪辑工具,利用AI快速分析生成视频脚本


    AI 视频内容分析,基于 Vue 3 + TypeScript 的智能视频分析应用,使用阿里云通义千问视觉模型自动分析视频内容,生成详细的脚本拆解表格。

    对于短视频的分析效果很好,速度很快,直接生成视频脚本,自动化拆解分析视频

    项目截图

    功能特性

    • 📹 视频分析:上传视频或提供视频 URL,AI 自动分析视频内容
    • 📊 脚本拆解:生成包含景别、运镜、画面内容、口播等详细信息的结构化表格
    • 🎬 视频片段预览:鼠标悬停即可播放对应时间段的视频片段
    • 🔐 安全存储:API Key 本地存储,保护隐私
    • 🎯 实时流式输出:Markdown 流式显示,所见即所得
    • 📈 Token 统计:实时显示输入/输出/总计 Token 使用量

    快速开始

    1. 安装依赖

    pnpm install

    2. 配置 API Key

    获取阿里云 DashScope API Key:https://help.aliyun.com/zh/model-studio/get-api-key

    方式一:在应用界面配置(推荐)

    • 启动应用后点击右上角”配置 API Key”按钮

    方式二:环境变量配置

    cp .env.example .env
    # 编辑 .env 文件,填入你的 API Key

    3. 启动开发服务器

    pnpm dev

    4. 构建生产版本

    pnpm build

    使用说明

    1. 启动应用后,点击上传区域选择视频文件(支持 MP4、MOV、AVI 等格式,最大 100MB)
    2. 点击”开始分析”按钮,等待 AI 分析完成
    3. 查看分析结果表格,鼠标悬停视频片段可预览播放

    注意事项

    • 视频文件最大支持 100MB
    • 视频使用浏览器直传到阿里云 OSS(无需经过服务器,节省带宽)
    • 视频内容需通过安全检查才能分析
    • API 调用需要有效的阿里云 DashScope API Key
    • 需要配置阿里云 OSS 环境变量(详见 .env.example

    项目地址

    github:https://github.com/kociii/youmedhub

    网站:https://www.youmedhub.com/

  • PushToTalk – 语音输入助手,按住快捷键说话,松开自动转录并插入文本,AI 智能助手,语音控制一切

    PushToTalk 是一个高性能的桌面语音输入工具,集成了大语言模型(LLM)能力。支持两种工作模式

    1. 听写模式:按住 Ctrl+Win 说话,松开后自动转录并插入文本,支持 LLM 智能润色
    2. AI 助手模式:选中文本后按 Alt+Space 说话,用语音命令处理选中的文本;或直接提问获得答案

    软件介绍

    PushToTalk 是一个高性能的桌面语音输入工具。它不仅仅是一个语音转文字工具,更集成了大语言模型(LLM)能力。你可以按住 Ctrl+Win 说话,松开后应用会自动将你的语音转为文字,并根据你的设定进行润色、翻译或整理成邮件,最后自动粘贴到当前光标位置。支持豆包/千问

    截图

    核心特性

    双模式工作

    • 🎤 听写模式 – 传统的语音转文字功能
      • 按住模式:按住快捷键录音,松开停止(传统方式)
      • 松手模式:按一次 F2 开始录音,再按一次结束(防止误停)
    • 🤖 AI 助手模式 – 语音控制文本处理
      • 无选中文本:Q&A 模式,提问获得答案
      • 选中文本:语音命令处理文本(翻译、润色、总结、扩写等)

    核心功能

    • ⚡ 实时流式转录 – WebSocket 边录边传,极低延迟(< 500ms),松手即出字
    • 🧠 LLM 智能后处理 – 内置”文本润色”、”邮件整理”、”中译英”等预设,支持自定义 Prompt
    • ⌨️ 自定义快捷键 – 支持 73 种按键绑定(修饰键、字母、数字、功能键、方向键等)
    • 🔄 多 ASR 引擎 – 支持阿里云 Qwen、豆包 Doubao、SiliconFlow SenseVoice
    • 🛡️ 智能兜底 – 主引擎失败时自动切换到备用引擎,并行竞速
    • 🎨 可视化反馈 – 录音状态悬浮窗,实时波形显示,三种视觉状态
    • 🔊 音频反馈 – 录音开始/结束的清脆提示音,盲操也放心
    • 📜 历史记录 – 自动保存转录历史,支持搜索、复制、清空
    • 🚀 系统托盘 – 支持最小化到托盘、开机自启动
    • 🔄 自动更新 – 内置 6 个镜像源,自动检查并安装更新
    • 💾 多配置管理 – 支持保存多套 LLM 预设,通过界面快速切换不同场景

     快速开始

    安装

    1. 从 Releases 下载最新版本的安装包
    2. 运行 NSIS 安装程序完成安装
    3. 右键点击应用图标,选择”以管理员身份运行”

    ⚠️ 重要:必须以管理员身份运行才能使用全局快捷键功能

    配置

    快捷链接

    API Key申请教学文档

    1. ASR 配置(至少配置一个)

    阿里云 Qwen(推荐)

    • 超大量的免费额度,2025 年 3 月前基本用不完
    • 支持实时流式和 HTTP 两种模式
    • 获取 DashScope API Key
    豆包 Doubao(可选)

    硅基流动 SenseVoice(可选,免费)

    2. 快捷键配置(可自定义)

    听写模式

    • 默认快捷键:Ctrl + Win
    • 松手模式快捷键:F2
    • 可自定义为任意组合键(支持 73 种按键)

    AI 助手模式

    • 默认快捷键:Alt + Space
    • 可自定义为任意组合键

    3. LLM 配置(可选)

    听写模式 LLM(文本润色)

    • 用于对转录结果进行润色、翻译等后处理
    • 推荐使用免费的智谱 GLM-4-Flash
    • 获取智谱 API Key
    • 可添加多个自定义预设(文本润色、中译英、邮件整理等)
    AI 助手模式 LLM(必需)

    • 用于 AI 助手模式的文本处理和问答
    • 支持 OpenAI 兼容接口
    • 配置两个系统提示词:
      • Q&A 提示词:用于回答问题
      • 文本处理提示词:用于处理选中的文本

    4. 系统设置(可选)

    • 关闭时最小化到托盘 – 关闭窗口时保持后台运行
    • 开机自启动 – 系统启动时自动运行(需要管理员权限)

    5. 保存并启动

    点击”保存配置”并”启动助手”。


    📖 使用指南

    听写模式

    按住模式(传统方式)

    1. 将光标定位在任何输入框(微信、Word、VS Code)
    2. 按住 Ctrl + Win 键,听到”滴”声后开始说话
    3. 说完松开按键,听到结束提示音
    4. 等待处理(悬浮窗显示处理状态),文本将自动打字上屏

    松手模式(防误停)

    1. 将光标定位在输入框
    2. 按一次 F2 键(可自定义),听到”滴”声后开始说话
    3. 说话时手可以松开,防止长时间说话时误停
    4. 说完后再按一次 F2 键,听到结束提示音
    5. 等待处理,文本将自动打字上屏

    松手模式悬浮窗

    • 蓝色药丸状态,中间显示迷你波形
    • 左边 ❌ 按钮:取消录音
    • 右边 ✓ 按钮:结束录音并转录
    • 60 秒超时自动取消

    AI 助手模式

    Q&A 模式(无选中文本)

    1. 将光标定位在输入框
    2. 按住 Alt + Space 键(可自定义),说出你的问题
    3. 例如:”What is the capital of France?”
    4. 松开按键,LLM 将自动回答并插入答案

    文本处理模式(选中文本)

    1. 在任何应用中选中一段文本
    2. 按住 Alt + Space 键,说出你的命令
    3. 常用命令示例:
      • “翻译成英文” – 将选中的中文翻译成英文
      • “润色一下” – 优化选中的文本
      • “总结一下” – 生成摘要
      • “扩写成三段” – 扩展内容
      • “添加注释” – 为代码添加注释
    4. 松开按键,LLM 将处理选中的文本并替换

    历史记录

    在主界面的”历史记录”标签页可查看所有转录记录:

    • 显示转录文本、时间、模式
    • 支持搜索功能
    • 点击复制按钮快速复制
    • 一键清空所有历史

    软件下载

    github:https://github.com/yyyzl/push-2-talk/releases/

    使用教程

  • BaseToolbox:基础工具箱,实用在线工具平台,包含图片处理,PDF处理,数学计算,开发者工具,二维码工具,SEO工具等

    基础工具箱-实用在线工具平台|图片,处理·二维码生成·多语言支持,BaseToolbox:基础工具箱,实用在线工具平台,包含图片处理,PDF处理,数学计算,开发者工具,二维码工具,SEO工具等

    网站截图

    网站链接

    https://www.basetoolbox.com/zh

  • OnlinePlayer:一款注重隐私的免费在线视频播放器。支持所有格式,无需安装,还支持openlist等网盘配置

    OnlinePlayer:您的首选在线视频播放器

    一款注重隐私的免费在线视频播放器,可在您的浏览器中运行。支持所有格式,无需安装。

    OnlinePlayer 基于 HTML5 Video API 构建,采用现代 Web 技术栈包括 React、Next.js 和 TypeScript。支持所有现代浏览器,提供原生级别的视频播放性能。支持拖放上传多个视频文件,让用户能够轻松管理播放列表。我们的播放器利用 Web 平台的力量和硬件加速技术,在不妥协性能或隐私的情况下提供无缝的视频播放体验。

    还可以嵌入到您的网站,使用 iframe 轻松将 OnlinePlayer 嵌入到您的网站

    网站截图

    入门指南

    1. 点击「选择视频文件」按钮或将视频文件拖放到播放器区域
    2. 您的视频将出现在右侧的播放列表中并自动开始播放
    3. 使用播放控件暂停、倒带、快进、调节音量和切换全屏

    键盘快捷键

    空格键: 播放/暂停

    →: 前进5秒

    ←: 后退5秒

    F: 全屏/退出全屏

    ↑/↓: 音量调节(仅全屏模式)

    M: 静音切换

    N/P: 下一个/上一个视频

    S: 停止播放

    故障排除

    视频无法播放

    确保您的浏览器支持 HTML5 视频。尝试刷新页面或使用不同的浏览器。

    视频质量差

    检查原始视频文件质量,OnlinePlayer 以原始质量播放您提供的视频文件。

    播放器无响应

    尝试清除浏览器缓存并重新加载页面。

    网站地址

    官网地址:https://onlineplayer.app/zh

  • emulatorgamer:免费在线经典游玩模拟器,收录超过两千款游戏,发现经典游戏系列及其跨越多个平台和数十年的完整作品集

    一个专注于经典模拟器游戏的网站,为用户提供各种经典模拟器游戏的在线畅玩,覆盖从红白机到PS等众多经典游戏平台的模拟器支持和游戏畅玩

    超过2000款经典游戏和老游戏的丰富收藏,全部可以免费在线游玩。模拟器游戏库涵盖了来自经典复古游戏主机的作品,包括FC、SFC、Game Boy、世嘉MD、PlayStation等。

    收藏中的每款经典游戏都经过复古游戏专家团队的精心筛选和测试,确保最佳的模拟器体验。从传奇的平台游戏和RPG到节奏紧凑的街机老游戏,发现定义了几代人游戏记忆的作品。

    基于浏览器的模拟器技术让您无需下载或安装即可即时游玩任何经典游戏。通过存档、自定义控制和全屏模式等功能,在任何设备上体验真正的复古游戏。

    网站支持的游戏平台极其丰富,包括任天堂系列(NES/Famicom、SNES、Nintendo 64、Game Boy Advance、Nintendo DS)、世嘉系列(Master System、Mega Drive、Game Gear、Saturn)、PlayStation以及Atari、Commodore等经典游戏机。

    用户无需安装任何软件,通过浏览器即可直接运行这些经典模拟器游戏,实现了”零安装即开即玩”。

    基于EmulatorJS技术构建,这是一个功能强大的网页前端模拟器项目。该技术采用WASM技术实现高性能解压,内置完整的压缩文件处理功能,支持7z、zip等格式的游戏文件直接解压运行。同时,项目支持多语言本地化,包括中文、英文、日文、西班牙语等多种语言,确保全球用户都能获得良好的使用体验。

    网站界面简洁直观,游戏库分类清晰,用户可以根据游戏平台或游戏类型快速找到想玩的游戏。所有模拟器都经过优化,在大多数现代浏览器中都能流畅运行,无论是Chrome、Firefox还是Edge都能完美兼容。

    网站截图

    网站地址

    https://emulatorgamer.com/zh-cn

  • 西瓜说:离线AI语音输入,对你的语音输入进行翻译、转写、润色等处理

    只需说出你的想法,系统会自动加工成专业、得体的文字输出,帮你轻松应对各种场景

    在应用设置中,你可以创建多个自定义人设模板。每个模板可以设定不同的风格和语气,比如专业助手、幽默段子手、会议记录员等。使用时快速切换,满足不同场景的需求。

    正在全力适配更多平台,优先选择了 Apple Silicon 是因为其优秀的性能能够更好地支持本地 AI 模型运行。Windows 和 Linux 版本正在开发中,敬请期待

    AI 模型经过优化,占用空间约 900 MB,相比带来的离线体验,这个代价是完全值得的。离线识别 + 在线精修,灵活使用。

    软件截图

    核心特性

    为创作者打造,让每一次语音输入都成为灵感的延伸

    本地二次转写:首次输出极快,二次优化精确。相同模型更优工程,离线情况下对实时识别内容二次优化,大大提升输出体验。

    AI 智能精修:支持标准 OpenAI 接口,一键翻译、转写、润色。说出你的想法,自动加工成专业话语。

    自定义人设:打造专属转写风格,百变星君就是你。随时切换,适应各种场景需求。

    使用场景

    从灵感闪现到专业输出,一站式搞定

    工作报告:语音转文字 + AI 润色,快速生成专业报告

    跨语言沟通:一键翻译,突破语言障碍

    社交互动:随时切换人设,让表达恰到好处

    软件下载

    下载安装包后直接安装即可,首次使用会自动下载 AI 模型。使用时按住快捷键(默认为 Fn)即可启动语音输入,松开后即可输入到任意文本框。在设置中配置 OpenAI 接口即可使用精修功能。

    官网地址:https://xiguasay.qwenkimi.com/

  • HopToDesk:免费开源远程桌面,远程控制软件,全平台支持,端到端加密

    HopToDesk是一个免费的远程桌面工具,允许用户分享他们的屏幕并允许远程控制访问他们的电脑和设备。 与TeamViewer或AnyDesk等其他类似工具不同,HopToDesk对个人和企业使用都是免费的,为所有同行通信提供真正的端到端加密,并且是开源的。

    您可以在您的服务器或现有基础设施上设置您自己的私有 HopToDesk 网络。 自托管也可以通过 AWS 或 Cloudflare Workers 来完成

    支持Windows,macOS,Linux,Android,iOS,Chrome OS,Raspberry Pi

    软件截图

    免费的远程桌面软件,具有实际的端到端加密流量、文件传输和即时聊天功能。

    多平台支持

    HopToDesk可在Windows、Mac、Linux、iOS、Android上运行,

    端到端加密

    所有流量都受到端到端加密的保护,包括屏幕共享、聊天和文件传输。

    免费和开放源代码

    免费供个人和商业使用,无限制。 欢迎为 HopToDesk 的开源项目做出贡献。

    软件下载

    开源地址:https://gitlab.com/hoptodesk/hoptodesk

    官网地址:https://www.hoptodesk.com/cn

  • WhisperJAV:一款生成日本*人视频字幕的AI字幕生成器,支持 DeepSeek(价格低廉)、Gemini(免费版)、Claude、GPT-4 和 OpenRouter。

    WhisperJAV不多介绍,通过AI给视频配字幕的工具,可以接入各种AI,是新鲜字幕自动生成,针对性优化,效果很好

    项目截图

    项目安装

    Windows Installer(最简单)

    下载并运行:WhisperJAV-1.7.4-Windows-x86_64.exe

    这会安装所有必需的软件,包括 Python 及其依赖项。

    从以前的安装程序版本升级

    如果您是通过 Windows 安装程序安装的 v1.5.x 或 v1.6.x 版本:

    1. 下载upgrade_whisperjav.bat
    2. 双击运行
    3. 等待1-2分钟

    这样就可以在不重新下载 PyTorch(约 2.5GB)或 AI 模型(约 3GB)的情况下更新 WhisperJAV。

    从源代码安装

    需要 Python 3.9-3.12、FFmpeg 和 Git。

    推荐:使用安装脚本(自动处理依赖冲突,自动检测 GPU):视窗

    git clone https://github.com/meizhong986/whisperjav.git
    cd whisperjav
    installer\install_windows.bat              # Auto-detects GPU and CUDA version
    installer\install_windows.bat --cpu-only   # Force CPU only
    installer\install_windows.bat --cuda118    # Force CUDA 11.8
    installer\install_windows.bat --cuda124    # Force CUDA 12.4
    installer\install_windows.bat --minimal    # Minimal install (no speech enhancement)
    installer\install_windows.bat --dev        # Development/editable install

    脚本会自动执行以下操作:

    • 检测您的 NVIDIA GPU 并选择最佳 CUDA 版本
    • 如果未找到 GPU,则回退到仅使用 CPU。
    • 检查 WebView2 运行时(GUI 需要)
    • 安装日志install_log_windows.txt
    • 下载失败后最多重试 3 次

    Linux / macOS

    # Install system dependencies first (Linux only)
    # Debian/Ubuntu:
    sudo apt-get install -y python3-dev build-essential ffmpeg libsndfile1
    
    # Fedora/RHEL:
    sudo dnf install python3-devel gcc ffmpeg libsndfile
    
    git clone https://github.com/meizhong986/whisperjav.git
    cd whisperjav
    chmod +x installer/install_linux.sh
    ./installer/install_linux.sh               # Auto-detects GPU
    ./installer/install_linux.sh --cpu-only    # Force CPU only
    ./installer/install_linux.sh --minimal     # Minimal install

    跨平台 Python 脚本

    git clone https://github.com/meizhong986/whisperjav.git
    cd whisperjav
    python install.py              # Auto-detects GPU, defaults to CUDA 12.1
    python install.py --cpu-only   # CPU only
    python install.py --cuda118    # CUDA 11.8
    python install.py --cuda121    # CUDA 12.1
    python install.py --cuda124    # CUDA 12.4
    python install.py --minimal    # Minimal install (no speech enhancement)
    python install.py --dev        # Development/editable install

    另一种方法:手动使用 pip 安装(可能会遇到依赖冲突):

    # Install PyTorch with GPU support first (NVIDIA example)
    pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu124
    
    # Then install WhisperJAV
    pip install git+https://github.com/meizhong986/whisperjav.git@main

    平台说明:

    • Apple Silicon(M1/M2/M3/M4):仅pip install torch torchaudio支持 MPS 加速,自动运行。
    • AMD GPU (ROCm):实验性功能。使用此功能--mode balanced可获得最佳兼容性。
    • 仅使用 CPU:可运行但速度较慢。用于--accept-cpu-mode跳过 GPU 警告。
    • Linux 服务器(无 GPU):安装脚本会自动检测并切换到仅使用 CPU 的模式。
    • Linux(Debian/Ubuntu):请先安装系统依赖项:sudo apt-get install -y python3-dev build-essential ffmpeg libsndfile1

    先决条件

    • Python 3.9-3.12(3.13+ 与 openai-whisper 不兼容)
    • 将 FFmpeg添加到系统路径中
    • 推荐显卡:NVIDIA CUDA、Apple MPS 或 AMD ROCm
    • 安装需要8GB 以上的磁盘空间

    免责声明

    此工具可生成辅助功能字幕。用户有责任遵守与其处理的内容相关的适用法律。

    项目地址

    https://github.com/meizhong986/WhisperJAV