作者： amiao

TidyMark：浏览器智能书签整理扩展，支持书签一键整理分类、扫描失效书签、备份书签等
用了很久的浏览器，不管是办公还是娱乐，想必大家收藏的书签应该有很多了。不知道大家有没有书签杂乱，没有分类和失效书签的困扰。

浏览器智能书签整理插件-TidyMark，支持备份书签、一键整理分类、AI 辅助优化、扫描失效书签、自动归档不常用书签、新标签页导航、访问热度统计等功能。

对于收藏超多书签的情况会有帮助，阿喵喜欢自动分类和扫描失效书签的功能，免费开源。

扩展介绍

TidyMark，一个轻量的 Chrome/Edge 扩展，支持书签自动分类、AI 辅助整理、失效书签检测，以及新标签页导航。基于 Manifest V3 原生实现。

截图

主要功能
- 智能书签整理：按规则一键分类，支持批量移动与清理空文件夹。
- AI 辅助整理（可选）：支持 OpenAI/DeepSeek，且可自定义 API 地址与模型。
- 失效书签检测：可限定文件夹扫描，忽略内网/本地地址；支持可选 DoH（Google/Cloudflare/阿里云）提升判断准确度。
- 备份与导出：支持本地 JSON 导出/恢复；云备份与每日自动同步支持 GitHub/WebDAV/Google Drive。
- 自动归档旧书签：阈值默认 180 天，可自定义。
- 右键菜单集成：一键添加并分类。
- 隐私与安全：不替换新标签页；所有整理在本地执行；云与 AI 仅在用户启用并配置后使用。
扩展下载

github地址：https://github.com/PanHywel/TidyMark

Chrome 应用商店：https://chromewebstore.google.com/detail/tidymark-%C2%B7-%E7%BA%AF%E4%B9%A6%E7%AD%BE%E6%95%B4%E7%90%86%E7%89%88/pbpfkmnamjpcomlcbdjhbgcpijfafiai?utm_source=item-share-cb

Edge扩展：https://microsoftedge.microsoft.com/addons/detail/tidymark-%C2%B7-%E7%BA%AF%E4%B9%A6%E7%AD%BE%E6%95%B4%E7%90%86%E7%89%88/dhpcgmaljdomhglcfjijpnhmaeppppfa
2025年10月31日
Paper2Video：学术论文自动生成演讲视频的工具，可将文章直接转换成 PPT 演讲视频
完成了一篇论文或者文章，但不擅长讲解，不知道如何讲解更清晰？

那让Paper2Video来帮助你吧，一个可以将学术论文转换成PPT并自动生成演讲视频的好项目。

提供一篇论文+一张作者照片+一段参考音频，它就能帮你生成一个生动的演讲解说视频。对于偏专业和学术性的场景，这个工具几乎能承担起人工完成的工作，做学术汇报和做课程的朋友有福了！

网站介绍

Paper2Video，一个自动化系统，旨在将学术论文（如 LaTeX 或 PDF）自动转换成完整的演讲视频，提供模块化架构，支持不同模型（如 GPT-4、Gemini、Hallo2 等）自由组合。

它能够根据论文内容自动生成幻灯片、字幕、语音讲解、光标指示，甚至可选的讲者视频，从而实现从论文到学术报告的全流程自动化，极大地简化了科研成果展示与传播的过程。

截图

这项工作解决了学术演讲的两个核心问题:
- 左边: 如何根据论文制作学术演讲?
  PaperTalker — 集成幻灯片、字幕、光标、语音合成和演讲者视频渲染的多智能体。
- 右边: 如何评估学术演讲视频?
  Paper2Video — 一个具有精心设计的指标来评估演示质量的基准。
快速上手

1. 环境配置

准备Python环境:
```
cd src
conda create -n p2v python=3.10
conda activate p2v
pip install -r requirements.txt
conda install -c conda-forge tectonic
```
[可选] 如果您不需要数字人展示，请跳过此部分。

下载所依赖代码，并按照Hallo2中的说明下载模型权重。
```
git clone https://github.com/fudan-generative-vision/hallo2.git
```
您需要单独准备用于 talking-head generation 的环境，以避免潜在的软件包冲突，请参考Hallo2。安装完成后，使用 which python 命令获取 Python 环境路径。
```
cd hallo2
conda create -n hallo python=3.10
conda activate hallo
pip install -r requirements.txt
```
2. 大语言模型配置

在终端配置您的API 凭证:
```
export GEMINI_API_KEY="your_gemini_key_here"
export OPENAI_API_KEY="your_openai_key_here"
```
最佳实践是针对 LLM 和 VLM 使用 GPT4.1 或 Gemini2.5-Pro。我们也支持本地部署开源模型（例如 Qwen），详情请参阅 Paper2Poster。

3. 推理

脚本 pipeline.py 提供了一个自动化的学术演示视频生成流程。它以 LaTeX 论文素材 和 参考图像/音频 作为输入，并经过多个子模块（幻灯片 → 字幕 → 语音 → 光标 → 头部特写）生成完整的演示视频。⚡ 运行此流程的最低推荐 GPU 为 NVIDIA A6000，显存 48G。

网站链接

github地址：https://github.com/showlab/Paper2Video

官方地址：https://showlab.github.io/Paper2Video/
2025年10月31日
TierRanker 从夯到拉生成器：生成在bilibili流行的”从夯到拉排行榜“并导出解说视频
最近抖音和哔哩哔哩很火的从夯到拉排行榜视频，不知道大家有没有看过。

现在你也可以自己自定义内容，并快速生成解说视频导出到本地。

网站介绍

TierRanker 从夯到拉生成器，一个可以自定义排行榜内容并一键生成视频的开源项目。可在线操作，支持录音、tts自动配音或上传音频，输入解说内容，最后一键生成解说视频。

网站截图

项目配置

环境变量配置
1. 复制 .env.example 文件并重命名为 .env.local：cp .env.example .env.local
2. 根据需要修改 .env.local 中的配置项
3. 默认使用免费的 gTTS (Google Text-to-Speech)，无需额外配置
TTS 配置详情

排行榜功能不需要设置参数，直接运行即可。视频导出需要配置TTS提供者，详细配置说明请参考 TTS_CONFIGURATION.md。

运行

本项目基于next.js，安装node.js,npm和相应依赖后，使用
```
npm run dev
```
启动项目。打开浏览器，访问http://localhost:3000即可。

项目链接

github地址：https://github.com/lixiang90/TierRanker

demo地址：https://tier-ranker-seven.vercel.app/
2025年10月30日
Have I Been Pwned：一个收录5亿个各类安全事件中被泄露用户密码的网站，在线检测你的密码是否被泄露

最近新闻爆出1.83 亿邮箱密码泄露，包含数千万 Gmail 账户！不过Google 发言人澄清这并非直接攻击 Gmail，而是恶意软件从用户电脑上获取登录信息。

一项大规模数据泄露暴露了超过 1.83 亿个邮箱密码，其中包括数千万个 Gmail 账户，被网络安全分析师称为史上最大的凭证泄露事件之一。这批被盗数据包含 3.5TB 信息，本月在网上曝光。

安全研究员 Troy Hunt 表示，这些信息来自长达一年的”信息窃取器”恶意软件网络扫描，该恶意软件秘密从受感染设备中窃取用户名、密码和网站地址。用户可访问 HaveIBeenPwned输入邮箱地址检查是否受影响。

网站介绍

Have I Been Pwned，一个可以检测你的密码是否被泄露的网站。该网站收录了5亿个在各类安全事件中被泄露的用户密码。

仅需输入您的邮箱地址，点击check即可检查到您使用邮箱注册的各大网站的密码是否存在泄露。

网站截图

网站链接

https://haveibeenpwned.com/

2025年10月30日
MuseBot：可本地部署的大模型智能机器人平台，实现自然对话和智能回复
项目介绍

MuseBot是一个基于 Golang 构建的智能机器人，集成了 LLM API，实现 AI 驱动的自然对话与智能回复。
它支持 OpenAI、DeepSeek、Gemini、Doubao、Qwen 等多种大模型，并可无缝接入 Telegram、Discord、Slack、Lark（飞书）、钉钉、企业微信、QQ、微信等聊天平台，为用户带来更加流畅、多平台联通的 AI 对话体验。

截图

功能特性
- 🤖 AI 回复：使用大模型 API 提供聊天机器人回复。
- ⏳ 流式输出：实时发送回复，提升用户体验。
- 🏗 轻松部署：可本地运行或部署到云服务器。
- 👀 图像识别：使用图片与大模型进行交流，详见文档。
- 🎺 支持语音：使用语音与大模型进行交流，详见文档。
- 🐂 函数调用：将 MCP协议转换为函数调用，详见文档。
- 🌊 RAG（检索增强生成）：支持 RAG以填充上下文，详见文档。
- 🌞 管理平台（AdminPlatform）：使用管理平台来管理MuseBot，详见文档。🌞 管理平台（AdminPlatform）：使用管理平台来管理MuseBot，详见文档。
- 🌛 注册中心：支持服务注册，机器人实例可自动注册，详见文档
- 🌈 监控数据：支持监控数据，详见文档。
项目链接

https://github.com/yincongcyincong/MuseBot
2025年10月30日
Hum to Search：在线音乐识别工具，唱歌、哼唱或播放以查找您的歌曲

只记得歌词，不记得歌的名字？只记得旋律，不记得歌词？Hum to Search都可以帮助你解决！

只需要哼唱几声Hum to Search就能是被出歌曲名称、歌手、专辑与发行时间。

阿喵试用了一下，有偏差，感兴趣可以试着玩一下。

网站介绍

Hum to Search 是最好的音乐识别应用程序。单击麦克风并哼唱您最喜爱的歌曲的清晰曲调，或者让 Hum to Search 聆听您周围播放的音乐。

Hum to Search 是一款基于 AI 音频识别技术的智能音乐搜索工具，只需轻轻哼唱几句旋律，就能在几秒内识别出歌曲名称、歌手、专辑与发行时间，并提供直达 Spotify、Apple Music、YouTube 的播放链接

它支持网页端直接使用，无需下载或注册，识别范围覆盖古典、流行、摇滚、爵士等多种曲风。应用内置智能降噪与音频分离算法，能在嘈杂环境中精准识别音乐。

网站截图

网站链接

https://www.humtosearch.app/

2025年10月30日
AI Doctor：AI 医疗会诊面板，纯前端多医生 AI 会诊模拟系统，让AI帮你分析会诊病情病因
AI现在真的强大，用AI来看病会诊也是个不错的方向，开发者DragonChenCL就开发了一套前端AI 医疗会诊面板，让AI帮你看病，配置好AI后，描述你的症状，多个AI医生参与会诊，轮流发言，互相评估，最终诊断你的病情

可添加多个由不同 LLM 驱动的医生。未填写 API Key 将使用模拟回复。本内容仅供参考，身体不适尽早就医

📖 项目简介

AI 医疗会诊面板是一个创新的医疗会诊模拟系统，通过集成多个大语言模型（LLM）扮演不同的医生角色，实现多专家协同诊断。系统采用纯前端架构，无需后端服务器，直接在浏览器中调用各大 AI 服务商的 API。

截图

特性
- 🏥 多医生协作：支持添加多个由不同 LLM 驱动的医生参与会诊
- 🤖 多模型支持：集成 OpenAI、Anthropic Claude、Google Gemini、硅基流动、魔搭社区等主流 AI 模型
- 💬 实时讨论：医生轮流发言，支持打字机效果展示
- 🗳️ 智能评估：医生互相评估彼此的诊断，自动淘汰不准确的意见
- 📊 状态监控：实时显示会诊阶段、轮次、医生状态等信息
- 💾 会话管理：自动保存会诊记录，支持多个问诊会话切换
- 🎨 美观界面：基于 Ant Design Vue 设计，界面简洁直观
- 📱 纯前端：无需服务器，所有数据保存在浏览器本地存储
使用指南

第一步：配置医生
1. 点击右上角的 “设置” 按钮
2. 在 “医生配置” 标签页中添加医生：
  - 输入医生名称（例如：Dr. GPT-4）
  - 选择供应商（OpenAI规范 / Anthropic规范 / Gemini规范 / 硅基流动 / 魔搭社区）
  - 填写对应的 API Key
  - 可选：自定义 Base URL（用于代理或私有部署）
  - 选择或输入模型名称
  - 可选：自定义医生的提示词
3. 点击 “添加医生” 按钮添加更多医生
4. 在 “问诊医生” 标签页中选择参与本次会诊的医生
第二步：输入病例信息
1. 在主页面填写病例信息：
  - 患者姓名（必填）
  - 年龄
  - 既往疾病史
  - 本次问题（必填）
2. 点击 “开始会诊” 按钮
第三步：观察会诊过程
- 医生将轮流发言，提出自己的诊断和建议
- 每轮讨论结束后，医生们会互相评估
- 被多数医生标记为”不太准确”的医生将被淘汰
- 会诊将持续到：
  - 只剩一位医生（该医生的诊断为最终答案）
  - 连续多轮无医生被淘汰（达到设定的上限）
第四步：查看最终答案

会诊结束后，系统会生成一份完整的诊断总结，包括：
- 核心诊断
- 诊断依据
- 鉴别诊断
- 检查建议
- 治疗建议
- 随访计划
- 风险提示
点击 “查看最终答案” 按钮即可查看，还可以导出为图片保存。

项目地址

github：https://dragonchencl.github.io/ai-doctor/

demo：https://dragonchencl.github.io/ai-doctor/
2025年10月30日
Transor：专业的AI翻译工具，网页、文档、图片与视频实时翻译
浏览器扩展介绍

Transor 是一款专业的 AI 翻译工具，帮助你轻松跨越语言障碍。支持文本、文档、图片甚至视频翻译，让你在浏览器中即可无缝阅读和理解全球内容。提供免费的网页、PDF、图片、视频字幕双语翻译，并支持大模型 AI 的高精度专业翻译。

支持 YouTube、Netflix 实时双语字幕翻译，无论观影、学习还是工作，外文内容即看即懂。独创的免费PDF双语翻译功能，让学术论文与商业合同都能一键对照阅读。更有图片翻译、划词翻译、输入框翻译、双语卡片分享等功能，全方位覆盖日常学习与办公场景。

截图

主要功能
- 网页翻译：通过智能识别网页的核心内容区域，实现低侵入性的双语对照翻译，为数百万用户带来了沉浸式的外文网页阅读体验。
- 视频字幕翻译：支持 YouTube、Netflix等主流视频网站的实时双语字幕翻译。原声配合双语字幕，让您既能看懂内容，又能在观影中自然提升外语水平。
- PDF翻译：免费 PDF 翻译，让文档支持双语阅读。依托 AI 翻译服务，无论是学术论文还是商业合同，都能一键获得专业结果。
- 图片翻译：Transor 插件支持网页图片翻译，右键或悬停即可完成。
- 划词翻译：在网页任意文本上选中即可用 AI 翻译成母语，并可一键收藏至个人收藏夹，支持数据导出。
- 输入框翻译：在网页输入框中输入文本后，快速连按 3 次空格即可翻译为目标语言（默认英语，可自定义）。无需跳出页面，搜索、写作、对话场景都能即刻完成翻译，体验更流畅。
- 双语卡片分享：选中网页文本即可生成可分享至社交平台的双语图片，也可在任意页面截图并裁剪，快速生成双语对照分享图。
获取链接

网站地址：https://transor.ai/zh-CN
2025年10月30日
Pixelhance：AI去除背景器，免费在线图像背景去除工具

网站介绍

Pixelhance，是一款基于AI技术的在线图像处理工具，可以在保留主要对象的同时自动识别和去除图像中的背景。

支持多种格式，如JPG、PNG、Webp等，处理速度快，效果自然。完全免费无需注册，且具备隐私保护功能。最大支持上传10MB且分辨率不超过4000✖️4000像素的图像。

阿喵试了一下，特别适合做证件照更换不同颜色的背景。

截图

特征

快如闪电：使用我们优化的 AI 算法在几秒钟内处理图像。无需等待，无需延迟。

像素完美：先进的人工智能可以保留每一个细节，甚至是头发和毛皮等复杂的边缘。

100% 私人：您的图像将得到安全处理并立即删除。完全保证隐私。

网站链接

https://pixelhance.com/

2025年10月29日
airegex：发票提取助手，在线免费批量提取电子发票信息到Excel

如果你有大量电子发票需要手动录入到Excel，可以使用这个在线发票提取工具-发票提取助手。

只需三步，首先整理电子发票.pdf格式，打包成一个ZIP压缩包，然后上传到网站上等待转换，最后下载excel即可。

网站页面简洁，操作方便，如果有整理发票的需求可以收藏啦。

网站介绍

airegex 是一款面向企业财务与个体商户的免费电子发票识别工具，可批量提取发票信息并导出为 Excel。用户只需上传电票文件，系统便能自动识别发票号码、金额、开票方、日期等关键信息，几秒生成标准表格，让发票录入不再耗时

全程网页操作、无需安装软件，兼具识别精准度高、操作流程简洁等优点。对财务人员、会计从业者来说，它是整理电票、准备税务申报的高效助手

网站截图

网站链接

https://airegex.cn/

2025年10月29日