写了两个实用的脚本获取知乎无水印图片 经常逛知乎,遇到好的回答/文章也会保存下来,但发现知乎有两个功能不是很喜欢,用油猴脚本解决了。 接下来介绍下这两个问题,以及原理,开发过程,开源地址等。 背景作为一只数据仓鼠,我经常会保存互联网上的内容,其中就包括知乎上的回答。 但很多时候,这些回答会神秘地消失,只留下空荡荡的收藏夹… ... 2025-10-23 3336 Views Read More
刚拿诺奖就登Nature封面!谷歌“量子回声”算法快超算13000倍,可重复验证结果 获得诺贝尔物理奖的谷歌量子团队,再登Nature封面: 提出“Quantum Echoes”(量子回声)新算法,算出来的结果还能重复验证,解决了之前量子计算结果难确认的问题。 经典超级计算机Frontier需要3.2年才能完成的计算,量子计算机仅用2.1小时就搞定,速度快了13000倍。 ... 2025-10-23 3019 Views Read More
国庆用 Gemini 写了一个工具网站,体验挺不错 在运营 toolai.io 的过程中,遇到一些需求: 1 、针对 PDF 文档,经常会有字体的问题,比如字体乱码、字体覆盖等,这时需要提取并预览排查 PDF 中的字体; 2 、在音频翻译流程中,需要给用户提供从本地视频中提取音频的工具,主打快捷; 3 、用户要求只翻译 PDF 的某些页,虽然在翻译流... 2025-10-09 1917 Views Read More
发现一款完全免费的在线压缩工具 compressimg.online 完全免费 https://compressimg.online/ 主要功能 压缩 JPEG 和 PNG 图像文件,通过调整压缩质量来减小文件体积。所有图像在压缩后均会输出为 JPEG 格式。 使用流程 上传图像:选择需要压缩的 JPEG 或 PNG 文件。 调整质量:使用质量滑块(范围... 2025-10-08 4964 Views Read More
原生国产自主可控类脑脉冲大模型SpikingBrain-瞬悉1.0发布 关于SpikingBrain SpikingBrain受大脑机制启发,将混合高效注意力机制、MoE 模块和脉冲编码集成到其架构中,并由与开源模型生态系统兼容的通用转换管道支持。这使得能够使用不到 2% 的数据进行持续预训练,同时实现与主流开源模型相当的性能。我们进一步针对非 NVIDIA(Me... 2025-09-09 3973 Views Read More
GPT-4O简介 技术分析 GPT-4o(“o”代表“omni”)旨在处理文本、音频和视频输入的组合,并可以生成文本、音频和图像格式的输出。 背景 在 GPT-4o 之前,用户可以使用语音模式与 ChatGPT 进行交互,该模式使用三个独立的模型运行。GPT-4o 将把这些功能集成到一个模型中,该模型在文本、视觉和音频方面... 2024-05-18 3943 Views Read More
ChatGPT 更新多模态,支持图片和语音输入,会带来哪些新体验和影响? 近日 OpenAI 宣布推出新版 ChatGPT,增加了两项新功能:语音输入和图像输入。据 OpenAI 称,新功能将在未来两周内向 ChatGPT Plus 订阅用户推出,其他人也将“很快”能够使用这些功能。 01:29 / 01:29 ... 2023-10-10 1401 Views Read More
开源社区新宠Mistral,最好的7B模型,羊驼都不香了 一个神秘磁力链接,成了开源大模型社区的新宠。 里面是来自法国的开源大模型Mistral-7B,大家试用下来,觉得Llama 2都不香了。 有开发者建议,代码之外的数据微调,34B以下规模先试试它就对了。 也有公司开始把它用在简历自动解析和评估业务上。 想基... 2023-10-10 2494 Views Read More
在 PromptBase 上赚到 AI 时代的第一桶金 本文将涉及以下科技公司及 AI 产品:PromptBase 自从 ChatGPT 开始火爆,这样的一个说法也流传开:未来大多数人都会成为 Prompt Engineer(提示词工程师)。 自然语言人机交互会带来提示词革命。这意味着,未来你的薪酬水平,将取决于你的提示词写得好不好,而不是取决于你的... 2023-10-10 4787 Views Read More