作者: amiao

  • TidyMark:浏览器智能书签整理扩展,支持书签一键整理分类、扫描失效书签、备份书签等

    用了很久的浏览器,不管是办公还是娱乐,想必大家收藏的书签应该有很多了。不知道大家有没有书签杂乱,没有分类和失效书签的困扰。

    浏览器智能书签整理插件-TidyMark,支持备份书签、一键整理分类、AI 辅助优化、扫描失效书签、自动归档不常用书签、新标签页导航、访问热度统计等功能。

    对于收藏超多书签的情况会有帮助,阿喵喜欢自动分类和扫描失效书签的功能,免费开源。

    扩展介绍

    TidyMark,一个轻量的 Chrome/Edge 扩展,支持书签自动分类、AI 辅助整理、失效书签检测,以及新标签页导航。基于 Manifest V3 原生实现。

    截图

    主要功能

    • 智能书签整理:按规则一键分类,支持批量移动与清理空文件夹。
    • AI 辅助整理(可选):支持 OpenAI/DeepSeek,且可自定义 API 地址与模型。
    • 失效书签检测:可限定文件夹扫描,忽略内网/本地地址;支持可选 DoH(Google/Cloudflare/阿里云)提升判断准确度。
    • 备份与导出:支持本地 JSON 导出/恢复;云备份与每日自动同步支持 GitHub/WebDAV/Google Drive。
    • 自动归档旧书签:阈值默认 180 天,可自定义。
    • 右键菜单集成:一键添加并分类。
    • 隐私与安全:不替换新标签页;所有整理在本地执行;云与 AI 仅在用户启用并配置后使用。

    扩展下载

    github地址:https://github.com/PanHywel/TidyMark

    Chrome 应用商店:https://chromewebstore.google.com/detail/tidymark-%C2%B7-%E7%BA%AF%E4%B9%A6%E7%AD%BE%E6%95%B4%E7%90%86%E7%89%88/pbpfkmnamjpcomlcbdjhbgcpijfafiai?utm_source=item-share-cb

    Edge扩展:https://microsoftedge.microsoft.com/addons/detail/tidymark-%C2%B7-%E7%BA%AF%E4%B9%A6%E7%AD%BE%E6%95%B4%E7%90%86%E7%89%88/dhpcgmaljdomhglcfjijpnhmaeppppfa

  • Paper2Video:学术论文自动生成演讲视频的工具,可将文章直接转换成 PPT 演讲视频

    完成了一篇论文或者文章,但不擅长讲解,不知道如何讲解更清晰?

    那让Paper2Video来帮助你吧,一个可以将学术论文转换成PPT并自动生成演讲视频的好项目。

    提供一篇论文+一张作者照片+一段参考音频,它就能帮你生成一个生动的演讲解说视频。对于偏专业和学术性的场景,这个工具几乎能承担起人工完成的工作,做学术汇报和做课程的朋友有福了!

    网站介绍

    Paper2Video,一个自动化系统,旨在将学术论文(如 LaTeX 或 PDF)自动转换成完整的演讲视频,提供模块化架构,支持不同模型(如 GPT-4、Gemini、Hallo2 等)自由组合。

    它能够根据论文内容自动生成幻灯片、字幕、语音讲解、光标指示,甚至可选的讲者视频,从而实现从论文到学术报告的全流程自动化,极大地简化了科研成果展示与传播的过程。

    截图

    这项工作解决了学术演讲的两个核心问题:

    • 左边: 如何根据论文制作学术演讲?
      PaperTalker — 集成幻灯片字幕光标语音合成演讲者视频渲染的多智能体。
    • 右边: 如何评估学术演讲视频?
      Paper2Video — 一个具有精心设计的指标来评估演示质量的基准。

    快速上手

    1. 环境配置

    准备Python环境:

    cd src
    conda create -n p2v python=3.10
    conda activate p2v
    pip install -r requirements.txt
    conda install -c conda-forge tectonic

    [可选] 如果您不需要数字人展示,请 跳过 此部分。

    下载所依赖代码,并按照Hallo2中的说明下载模型权重。

    git clone https://github.com/fudan-generative-vision/hallo2.git

    您需要单独准备用于 talking-head generation 的环境,以避免潜在的软件包冲突,请参考Hallo2。安装完成后,使用 which python 命令获取 Python 环境路径。

    cd hallo2
    conda create -n hallo python=3.10
    conda activate hallo
    pip install -r requirements.txt

    2. 大语言模型配置

    在终端配置您的API 凭证:

    export GEMINI_API_KEY="your_gemini_key_here"
    export OPENAI_API_KEY="your_openai_key_here"

    最佳实践是针对 LLM 和 VLM 使用 GPT4.1 或 Gemini2.5-Pro。我们也支持本地部署开源模型(例如 Qwen),详情请参阅 Paper2Poster

    3. 推理

    脚本 pipeline.py 提供了一个自动化的学术演示视频生成流程。它以 LaTeX 论文素材 和 参考图像/音频 作为输入,并经过多个子模块(幻灯片 → 字幕 → 语音 → 光标 → 头部特写)生成完整的演示视频。⚡ 运行此流程的最低推荐 GPU 为 NVIDIA A6000,显存 48G。

    网站链接

    github地址:https://github.com/showlab/Paper2Video

    官方地址:https://showlab.github.io/Paper2Video/

  • TierRanker 从夯到拉生成器:生成在bilibili流行的”从夯到拉排行榜“并导出解说视频

    最近抖音和哔哩哔哩很火的从夯到拉排行榜视频,不知道大家有没有看过。

    现在你也可以自己自定义内容,并快速生成解说视频导出到本地。

    网站介绍

    TierRanker 从夯到拉生成器,一个可以自定义排行榜内容并一键生成视频的开源项目。可在线操作,支持录音、tts自动配音或上传音频,输入解说内容,最后一键生成解说视频。

    网站截图

    项目配置

    环境变量配置

    1. 复制 .env.example 文件并重命名为 .env.local:cp .env.example .env.local
    2. 根据需要修改 .env.local 中的配置项
    3. 默认使用免费的 gTTS (Google Text-to-Speech),无需额外配置

    TTS 配置详情

    排行榜功能不需要设置参数,直接运行即可。视频导出需要配置TTS提供者,详细配置说明请参考 TTS_CONFIGURATION.md

    运行

    本项目基于next.js,安装node.js,npm和相应依赖后,使用

    npm run dev

    启动项目。打开浏览器,访问http://localhost:3000即可。

    项目链接

    github地址:https://github.com/lixiang90/TierRanker

    demo地址:https://tier-ranker-seven.vercel.app/

  • Have I Been Pwned:一个收录5亿个各类安全事件中被泄露用户密码的网站,在线检测你的密码是否被泄露

    最近新闻爆出1.83 亿邮箱密码泄露,包含数千万 Gmail 账户!不过Google 发言人澄清这并非直接攻击 Gmail,而是恶意软件从用户电脑上获取登录信息。

    一项大规模数据泄露暴露了超过 1.83 亿个邮箱密码,其中包括数千万个 Gmail 账户,被网络安全分析师称为史上最大的凭证泄露事件之一。这批被盗数据包含 3.5TB 信息,本月在网上曝光。

    安全研究员 Troy Hunt 表示,这些信息来自长达一年的”信息窃取器”恶意软件网络扫描,该恶意软件秘密从受感染设备中窃取用户名、密码和网站地址。用户可访问 HaveIBeenPwned输入邮箱地址检查是否受影响。

    网站介绍

    Have I Been Pwned,一个可以检测你的密码是否被泄露的网站。该网站收录了5亿个在各类安全事件中被泄露的用户密码。

    仅需输入您的邮箱地址,点击check即可检查到您使用邮箱注册的各大网站的密码是否存在泄露。

    网站截图

    网站链接

    https://haveibeenpwned.com/

  • MuseBot:可本地部署的大模型智能机器人平台 ,实现自然对话和智能回复

    项目介绍

    MuseBot是一个基于 Golang 构建的 智能机器人,集成了 LLM API,实现 AI 驱动的自然对话与智能回复。
    它支持 OpenAI、DeepSeek、Gemini、Doubao、Qwen 等多种大模型,并可无缝接入 Telegram、Discord、Slack、Lark(飞书)、钉钉、企业微信、QQ、微信 等聊天平台,为用户带来更加流畅、多平台联通的 AI 对话体验。

    截图

    功能特性

    • 🤖 AI 回复:使用 大模型 API 提供聊天机器人回复。
    • ⏳ 流式输出:实时发送回复,提升用户体验。
    • 🏗 轻松部署:可本地运行或部署到云服务器。
    • 👀 图像识别:使用图片与 大模型进行交流,详见文档
    • 🎺 支持语音:使用语音与 大模型进行交流,详见文档
    • 🐂 函数调用:将 MCP协议转换为函数调用,详见文档
    • 🌊 RAG(检索增强生成):支持 RAG以填充上下文,详见文档
    • 🌞 管理平台(AdminPlatform):使用管理平台来管理MuseBot,详见文档。🌞 管理平台(AdminPlatform) :使用管理平台来管理MuseBot,详见文档 。
    • 🌛 注册中心:支持服务注册,机器人实例可自动注册,详见 文档
    • 🌈 监控数据:支持监控数据,详见文档

    项目链接

    https://github.com/yincongcyincong/MuseBot

  • Hum to Search:在线音乐识别工具,唱歌、哼唱或播放以查找您的歌曲

    只记得歌词,不记得歌的名字?只记得旋律,不记得歌词?Hum to Search都可以帮助你解决!

    只需要哼唱几声Hum to Search就能是被出歌曲名称、歌手、专辑与发行时间。

    阿喵试用了一下,有偏差,感兴趣可以试着玩一下。

    网站介绍

    Hum to Search 是最好的音乐识别应用程序。单击麦克风并哼唱您最喜爱的歌曲的清晰曲调,或者让 Hum to Search 聆听您周围播放的音乐。

    Hum to Search 是一款基于 AI 音频识别技术 的智能音乐搜索工具,只需轻轻哼唱几句旋律,就能在几秒内识别出歌曲名称、歌手、专辑与发行时间,并提供直达 Spotify、Apple Music、YouTube 的播放链接

    它支持 网页端直接使用,无需下载或注册,识别范围覆盖古典、流行、摇滚、爵士等多种曲风。应用内置 智能降噪与音频分离算法,能在嘈杂环境中精准识别音乐。

    网站截图

    网站链接

    https://www.humtosearch.app/

  • AI Doctor:AI 医疗会诊面板,纯前端多医生 AI 会诊模拟系统,让AI帮你分析会诊病情病因

    AI现在真的强大,用AI来看病会诊也是个不错的方向,开发者DragonChenCL就开发了一套前端AI 医疗会诊面板,让AI帮你看病,配置好AI后,描述你的症状,多个AI医生参与会诊,轮流发言,互相评估,最终诊断你的病情

    可添加多个由不同 LLM 驱动的医生。未填写 API Key 将使用模拟回复。本内容仅供参考,身体不适尽早就医

    📖 项目简介

    AI 医疗会诊面板是一个创新的医疗会诊模拟系统,通过集成多个大语言模型(LLM)扮演不同的医生角色,实现多专家协同诊断。系统采用纯前端架构,无需后端服务器,直接在浏览器中调用各大 AI 服务商的 API。

    截图

    特性

    • 🏥 多医生协作:支持添加多个由不同 LLM 驱动的医生参与会诊
    • 🤖 多模型支持:集成 OpenAI、Anthropic Claude、Google Gemini、硅基流动、魔搭社区等主流 AI 模型
    • 💬 实时讨论:医生轮流发言,支持打字机效果展示
    • 🗳️ 智能评估:医生互相评估彼此的诊断,自动淘汰不准确的意见
    • 📊 状态监控:实时显示会诊阶段、轮次、医生状态等信息
    • 💾 会话管理:自动保存会诊记录,支持多个问诊会话切换
    • 🎨 美观界面:基于 Ant Design Vue 设计,界面简洁直观
    • 📱 纯前端:无需服务器,所有数据保存在浏览器本地存储

    使用指南

    第一步:配置医生

    1. 点击右上角的 “设置” 按钮
    2. 在 “医生配置” 标签页中添加医生:
      • 输入医生名称(例如:Dr. GPT-4)
      • 选择供应商(OpenAI规范 / Anthropic规范 / Gemini规范 / 硅基流动 / 魔搭社区)
      • 填写对应的 API Key
      • 可选:自定义 Base URL(用于代理或私有部署)
      • 选择或输入模型名称
      • 可选:自定义医生的提示词
    3. 点击 “添加医生” 按钮添加更多医生
    4. 在 “问诊医生” 标签页中选择参与本次会诊的医生

    第二步:输入病例信息

    1. 在主页面填写病例信息:
      • 患者姓名(必填)
      • 年龄
      • 既往疾病史
      • 本次问题(必填)
    2. 点击 “开始会诊” 按钮

    第三步:观察会诊过程

    • 医生将轮流发言,提出自己的诊断和建议
    • 每轮讨论结束后,医生们会互相评估
    • 被多数医生标记为”不太准确”的医生将被淘汰
    • 会诊将持续到:
      • 只剩一位医生(该医生的诊断为最终答案)
      • 连续多轮无医生被淘汰(达到设定的上限)

    第四步:查看最终答案

    会诊结束后,系统会生成一份完整的诊断总结,包括:

    • 核心诊断
    • 诊断依据
    • 鉴别诊断
    • 检查建议
    • 治疗建议
    • 随访计划
    • 风险提示

    点击 “查看最终答案” 按钮即可查看,还可以导出为图片保存。

    项目地址

    github:https://dragonchencl.github.io/ai-doctor/

    demo:https://dragonchencl.github.io/ai-doctor/

  • Transor:专业的AI翻译工具,网页、文档、图片与视频实时翻译

    浏览器扩展介绍

    Transor 是一款专业的 AI 翻译工具,帮助你轻松跨越语言障碍。支持文本、文档、图片甚至视频翻译,让你在浏览器中即可无缝阅读和理解全球内容。提供免费的网页、PDF、图片、视频字幕双语翻译,并支持大模型 AI 的高精度专业翻译。

    支持 YouTube、Netflix 实时双语字幕翻译,无论观影、学习还是工作,外文内容即看即懂。独创的 免费PDF双语翻译功能,让学术论文与商业合同都能一键对照阅读。更有 图片翻译、划词翻译、输入框翻译、双语卡片分享等功能,全方位覆盖日常学习与办公场景。

    截图

    主要功能

    • 网页翻译:通过智能识别网页的核心内容区域,实现低侵入性的双语对照翻译,为数百万用户带来了沉浸式的外文网页阅读体验。
    • 视频字幕翻译:支持 YouTube、Netflix等主流视频网站的实时双语字幕翻译。原声配合双语字幕,让您既能看懂内容,又能在观影中自然提升外语水平。
    • PDF翻译:免费 PDF 翻译,让文档支持双语阅读。依托 AI 翻译服务,无论是学术论文还是商业合同,都能一键获得专业结果。
    • 图片翻译:Transor 插件支持网页图片翻译,右键或悬停即可完成。
    • 划词翻译:在网页任意文本上选中即可用 AI 翻译成母语,并可一键收藏至个人收藏夹,支持数据导出。
    • 输入框翻译:在网页输入框中输入文本后,快速连按 3 次空格即可翻译为目标语言(默认英语,可自定义)。无需跳出页面,搜索、写作、对话场景都能即刻完成翻译,体验更流畅。
    • 双语卡片分享:选中网页文本即可生成可分享至社交平台的双语图片,也可在任意页面截图并裁剪,快速生成双语对照分享图。

    获取链接

    网站地址:https://transor.ai/zh-CN

  • Pixelhance:AI去除背景器,免费在线图像背景去除工具

    网站介绍

    Pixelhance,是一款基于AI技术的在线图像处理工具,可以在保留主要对象的同时自动识别和去除图像中的背景。

    支持多种格式,如JPG、PNG、Webp等,处理速度快,效果自然。完全免费无需注册,且具备隐私保护功能。最大支持上传10MB且分辨率不超过4000✖️4000像素的图像。

    阿喵试了一下,特别适合做证件照更换不同颜色的背景。

    截图

    特征

    快如闪电:使用我们优化的 AI 算法在几秒钟内处理图像。无需等待,无需延迟。

    像素完美:先进的人工智能可以保留每一个细节,甚至是头发和毛皮等复杂的边缘。

    100% 私人:您的图像将得到安全处理并立即删除。完全保证隐私。

    网站链接

    https://pixelhance.com/

  • airegex:发票提取助手,在线免费批量提取电子发票信息到Excel

    如果你有大量电子发票需要手动录入到Excel,可以使用这个在线发票提取工具-发票提取助手

    只需三步,首先整理电子发票.pdf格式,打包成一个ZIP压缩包,然后上传到网站上等待转换,最后下载excel即可。

    网站页面简洁,操作方便,如果有整理发票的需求可以收藏啦。

    网站介绍

    airegex 是一款面向企业财务与个体商户的 免费电子发票识别工具,可 批量提取发票信息并导出为 Excel。用户只需上传电票文件,系统便能自动识别 发票号码、金额、开票方、日期 等关键信息,几秒生成标准表格,让发票录入不再耗时

    全程 网页操作、无需安装软件,兼具 识别精准度高、操作流程简洁 等优点。对财务人员、会计从业者来说,它是整理电票、准备税务申报的高效助手

    网站截图

    网站链接

    https://airegex.cn/