博客

  • Chrome Piano:在线弹钢琴,一款通过键盘或鼠标来演奏钢琴的浏览器扩展插件

    一款可以在浏览器中弹奏钢琴的工具。可以通过键盘或鼠标来演奏钢琴,几乎没有学习曲线,适合所有水平的音乐爱好者。

    提供了丰富的音乐曲目供选择,可以录制自己的音乐并进行回放

    录制您自己的音乐,或从乐谱中挑选多位艺术家的歌曲。几乎没有学习难度。您只需要键盘或鼠标。

    插件截图

    插件功能

    – 从众多精选乐曲中弹奏钢琴

    – 录音和播放 – 兼容键盘和鼠标

    – 深色主题和浅色主题

    插件地址

    chrome商店链接:https://chromewebstore.google.com/detail/chrome-piano/pjafcgbpdclmdeiipolenjgkikeldljl

  • Calendr,开源macOS菜单栏日历,支持日程提醒,菜单界面自定义

    经常使用macOS的用户,肯定会频繁使用macOS的菜单栏,并且会在右上角显示时间日期,但是系统自带的时间显示就单纯只是时间显示。不能显示整月的日期,不能显示今天的事项提醒等,这个时候就需要借助第三方的可以显示在菜单栏的日历软件,阿喵我测试了几个,今天给大家分享这个免费开源的菜单栏日历神器:Calendr – Menu bar calendar for macOS

    软件截图

    软件下载

    开源地址:https://github.com/pakerwreah/Calendr

  • Hover Zoom+:缩放图像、视频的 Google Chrome 扩展程序

    浏览器插件介绍

    Hover Zoom+,是原始HoverZoom扩展的开源版本,可以在网站(Facebook、Amazon等)上缩放图像/视频,只需将鼠标悬停在图像上方即可放大。将你的鼠标指针指向任何被支持的网站图片上,这个扩展会自动把图片/视频放大至全尺寸,确保图片适合浏览器窗口。

    截图

    下载链接

    项目地址:https://github.com/extesy/hoverzoom

    Chrome 应用商店:https://chromewebstore.google.com/detail/hover-zoom+/pccckmaobkjjboncdfnnofkonhgpceea

  • MultiAgentPPT:基于 A2A + MCP + ADK 的多智能体系统,生成高质量PPT 内容

    作为办公室牛马打工仔,相信很少有人能躲过做PPT。如果可以自动化生成高质量PPT文稿那就很美味了。

    MultiAgentPPT 是一个创新的开源项目,利用多智能体协作技术,帮助用户快速生成结构清晰、内容丰富的 PPT。如果你经常需要制作演示文稿,或者对多智能体系统的实际应用感兴趣,这个项目值得一试。

    项目介绍

    MultiAgentPPT 是一个基于多智能体系统的 PPT 自动生成工具,通过多个智能体分工协作(如内容生成、排版设计、图表优化等),可以将你输入的主题或大纲转化为完整的 PPT 文件。项目采用 Python 实现,支持 Markdown 或自然语言输入,并可导出为 PowerPoint(.pptx)格式。

    截图

    主要步骤包括:

    • Summary Agent 汇总输出:将调研结果汇总生成 PPT 内容,实时流式返回前端。
    • 大纲生成 Agent:根据用户需求生成初步内容大纲。
    • Topic 拆分 Agent:将大纲内容细分为多个主题。
    • Research Agent 并行工作:多个智能体分别对每个主题进行深入调研。

    特色

    • 多Agent协作:通过多智能体并行工作,提高内容生成的效率和准确性。
    • 实时流式返回:支持流式返回生成的 PPT 内容,提升用户体验。
    • 高质量内容:结合外部检索和智能体协作,生成高质量的内容大纲和演示文稿。
    • 可扩展性:系统设计灵活,易于扩展新的智能体和功能模块。

    项目链接

    https://github.com/johnson7788/MultiAgentPPT

  • Tabl:一个多人协作的浏览器,多玩家web浏览器

    软件介绍

    Tabl 将类似 Figma 的协作体验带到浏览器标签页中,当你跟小伙伴们同时使用 Tabl 时,彼此可以看到各自的鼠标轨迹以及打开的页面

    免费版最多支持 4 人,支持Windows、macOS。

    截图

    获取链接

    https://tablbrowser.com

  • QUIK:适用于 Android的短信消息接收软件

    软件介绍

    QUIK 是 Android 上股票消息应用程序的开源替代品。它是 QKSMS 的延续。

    免费开源,没有广告,Android 第三方短信应用,功能非常丰富,支持定时发送、语音转文字、附件传输、群发消息、备份还原、消息过滤与拦截、快速回复、TTS 播报、草稿保存、彩色主题自定义等功能。

    截图

    特征

    • 定时消息
    • 消息备份
    • 应用程序中集成的 Speech to Text 和 Text to Speech
    • 邮件拦截和归档
    • 语音消息
    • 任何类型文件的附件
    • 消息排序
    • 延迟发送

    软件下载

  • LiYing:证件照图像处理,自动化完成照相馆照片后期排版

    项目介绍

    LiYing 是一套适用于自动化完成一般照相馆后期证件照处理流程的照片自动处理的程序。

    可以完成人体、人脸自动识别,角度自动纠正,自动更换任意背景色,任意尺寸证件照自动裁切,并自动排版。可以完全离线运行。所有图像处理操作都在本地运行。

    项目截图

    项目链接

    项目地址:https://github.com/aoguai/LiYing

  • Prompt Optimizer:提示词优化器,助力编写高质量的提示词

    介绍

    Prompt Optimizer是一个强大的AI提示词优化工具,帮助你编写更好的AI提示词,提升AI输出质量。支持Web应用和Chrome插件两种使用方式。

    截图

    核心特性

    • 🎯 智能优化:一键优化提示词,支持多轮迭代改进,提升AI回复准确度
    • 🔄 对比测试:支持原始提示词和优化后提示词的实时对比,直观展示优化效果
    • 🤖 多模型集成:支持OpenAI、Gemini、DeepSeek、智谱AI、SiliconFlow等主流AI模型
    • ⚙️ 高级参数配置:支持为每个模型单独配置temperature、max_tokens等LLM参数
    • 🔒 安全架构:纯客户端处理,数据直接与AI服务商交互,不经过中间服务器
    • 💾 隐私保护:本地加密存储历史记录和API密钥,支持数据导入导出
    • 📱 多端支持:同时提供Web应用和Chrome插件两种使用方式
    • 🎨 用户体验:简洁直观的界面设计,响应式布局和流畅交互动效
    • 🌐 跨域支持:Vercel部署时支持使用Edge Runtime代理解决跨域问题
    • 🔐 访问控制:支持密码保护功能,保障部署安全

    链接

    项目地址:https://github.com/linshenkx/prompt-optimizer

    在线地址:https://prompt.always200.com/

  • 浸入式学语言助手:一款基于”可理解输入”理论的浏览器扩展,帮助你在日常网页浏览中自然地学习语言。

    项目介绍

    浸入式学语言助手,一款基于”可理解输入”理论的浏览器扩展,帮助你在日常网页浏览中自然地学习语言。

    集成了完整的发音学习生态系统和智能多语言翻译功能,包括自动语言检测、音标显示、AI词义解释、双TTS语音合成和交互式悬浮框,为用户提供从智能翻译到发音学习的一站式沉浸式体验。

    项目截图

    功能特性

    🎯 核心翻译引擎

    • 智能语言检测: AI自动识别网页源语言,无需用户手动指定语言类型
    • 智能文本处理: 使用大语言模型分析网页内容,智能选择适合用户水平的词汇进行翻译
    • 精确替换控制: 可精确控制翻译比例(1%-100%),支持字符级精确计算
    • 上下文感知: 考虑语境和用户水平,选择最合适的翻译词汇
    • 多语言支持: 支持20+种语言的智能翻译(英语、日语、韩语、法语、德语、西班牙语、俄语、意大利语、葡萄牙语、荷兰语、瑞典语、挪威语、丹麦语、芬兰语、波兰语、捷克语、土耳其语、希腊语等)理论上依赖大模型能力
    • 翻译位置控制: 新增翻译文本位置自定义功能,更灵活的显示方式
    • 括号显示控制: 可选择是否显示翻译文本的括号,提供更清爽的阅读体验

    🔊 发音学习生态系统 ⭐

    • 交互式悬浮框: 鼠标悬停翻译词汇即可查看音标、AI词义和朗读功能,智能定位避免边界溢出
    • 双层学习体验: 短语显示可交互的单词列表,点击单个单词查看详细信息,支持嵌套悬浮框
    • 多TTS服务支持: 集成有道TTS(高质量)和Web Speech API(备用),支持英式/美式发音切换
    • 智能音标获取: 自动获取Dictionary API音标数据,24小时TTL缓存优化性能
    • AI词义解释: 实时调用AI生成中文词义解释,理解更准确,支持上下文语境分析
    • 渐进式加载: 先显示基础信息,再异步加载详细内容,优化用户体验
    • 音频缓存: 内存级TTS音频缓存,同一单词无需重复生成语音
    • 快捷键支持: 新增发音弹出框快捷键设置,提升操作效率

    🎨 丰富的视觉体验

    • 7种翻译样式: 默认、微妙、粗体、斜体、下划线、高亮、学习模式(模糊效果)
    • 学习模式: 翻译词汇初始模糊显示,鼠标悬停时清晰化,增强记忆效果
    • 辉光动画: 新翻译词汇出现时的柔和提示效果,不干扰阅读体验
    • 响应式设计: 自适应深色/浅色主题,智能悬浮框定位
    • 悬浮工具球: 新增可配置的悬浮工具球,快速访问常用功能

    ⚙️ 高度可配置性

    • 智能翻译模式: 用户只需选择目标语言,AI自动检测源语言并进行翻译
    • 用户水平适配: 从初级到精通5个级别,AI智能调整词汇难度和选择策略
    • 触发模式: 支持自动触发(页面加载时处理)和手动触发两种工作方式
    • 原文显示控制: 可选择显示、隐藏或学习模式(模糊效果)显示被翻译的原文
    • 段落长度控制: 自定义AI单次处理的最大文本长度
    • 发音功能开关: 可独立控制发音悬浮框功能的启用状态
    • 多API配置: 支持配置多个API服务,可灵活切换不同的翻译服务提供商
    • 数据导入导出: 新增配置数据的导入导出功能,方便备份和迁移

    🔌 开放式API集成

    • 兼容OpenAI API: 支持任何兼容 OpenAI 格式的AI服务(ChatGPT、Claude、豆包等国产大模型)
    • 灵活配置: 自定义API Key、Endpoint、模型名称、Temperature参数
    • 智能提示词: 根据翻译方向和用户水平动态生成最优提示词
    • 错误处理: 完善的API错误处理和重试机制
    • 多API支持: 支持配置多个API服务并灵活切换,提供更可靠的服务保障

    🚀 性能与优化

    • 智能缓存: 翻译结果、音标数据、TTS音频多级缓存策略
    • 增量处理: 只处理新增内容,避免重复翻译
    • DOM安全: 使用Range API确保DOM结构完整性
    • 内存管理: 及时清理监听器,优化内存使用

    💻 现代技术架构

    • 框架WXT – 现代WebExtension开发框架
    • 前端: Vue 3 + TypeScript + Vite
    • UI库: Tailwind CSS + Lucide Icons
    • 构建: ESLint + Prettier + TypeScript编译
    • API集成: OpenAI兼容接口 + Dictionary API + 有道TTS
    • 跨浏览器兼容: 支持Chrome、Edge、Firefox,部分支持Safari

    🌐 浏览器兼容性

    本扩展基于 Web Extension API 和 WXT 构建,支持以下浏览器:

    浏览器支持状态特殊说明
    Chrome✅ 完全支持推荐环境,所有功能可用
    Edge✅ 完全支持基于Chromium,完整兼容
    Firefox✅ 支持需配置addon ID,详见Firefox安装指南
    Safari⚠️ 部分支持需要额外配置,自行查询

    项目链接

    https://github.com/xiao-zaiyi/illa-helper