当前位置: 首页 新闻详细

不用写一行代码,deepseek结合腾讯云语音识别来批量转录Mp3音频,围绕deepseek的争吵和网络攻击,都是怎么回事,简单做几个解释

专业小程序设计开发——助力新电商新零售

电话+V:159999-78052,欢迎咨询deepseek能帮我们做什么,[小程序设计与开发],[小程序投流与推广],[小程序后台搭建],[小程序整套源码打包],[为个体及小微企业助力],[电商新零售模式],[小程序运营推广及维护]

一、不用写一行代码,deepseek结合腾讯云语音识别来批量转录Mp3音频

首先,操作窗口系统中的命令行工具(如cmd或powershell),安装腾讯云的Python库:


使用pip命令执行如下安装指令,确保链接正确:


pipinstall-imirrors.tencent.com/pyp...--upgradetencentcloud-sdk-python


随后,开启腾讯云的对象存储COS服务,上传要转录的mp3音频文件至存储桶,并将存储桶的访问权限设置为:公有读私有写。


申请腾讯云语音识别资源包的免费额度,每月1号自动发放,有效期当月,额度形式为预付费资源包。


在AI大模型聊天应用deepseek中输入提示词,编写通过腾讯云语音识别API的批量AI语音识别Python脚本。


在脚本中插入以下内容:腾讯云SecretId和SecretKey信息,音频文件URL列表,以及保存结果的本地目录。


具体步骤如下:



  • 使用SecretId和SecretKey创建腾讯云API调用所需的签名APPID、SecretId与SecretKey信息。

  • 将音频文件URL列表插入脚本中。

  • 定义保存识别结果的本地目录。


  • 定义脚本中的核心函数,包括创建语音识别任务和查询任务状态:



    1. 创建识别任务函数:尝试通过URL创建任务,打印任务ID,并返回任务ID。

    2. 查询任务状态函数:根据任务ID查询任务状态,返回查询结果。


    定义保存识别结果到文件的函数:解码音频文件名,将识别结果保存到指定目录下的对应txt文件中。


    主函数中,使用SecretId、SecretKey和API客户端配置文件初始化API调用,循环处理音频文件列表。



    1. 对每个音频文件执行创建任务、查询状态和保存结果操作。


    在执行过程中,确保输出错误信息和状态更新到屏幕上。


    识别完成后,根据实际需要,查看语音识别资源包调用情况和剩余免费额度。


    将上述代码复制到VSCode中运行,实现mp3音频文件的批量转录。


    使用腾讯云语音识别服务,可快速完成音频转文本任务,效率高且准确率表现良好。识别完成后,可以查看资源包使用情况,了解剩余的免费额度。

    二、ComfyUI分享06-这两款反推提示词插件,推荐你也可以试试

    在StableDiffusion中,反推提示词插件被广泛应用,如WD14和ComfyUI-WD14-Tagger。随着ComfyUI生态的扩展,更多插件被开发出来,例如利用阿里的通义千问API和深寻的本地模型。

    第一款插件,ComfyUI-Qwen-VL-API,由ZHO佬制作,接入阿里QWen-VL双模型(PlusMax),为用户提供视觉模型服务。用户需在阿里云官网开通服务获取API-key,并安装插件,将API-key填写至config.json文件中,以实现图像反推功能。

    另一款插件,ComfyUI-DeepSeek-VL,为DeepSeek-VL模型,具备通用的多模态理解能力,支持复杂场景下的图像处理。用户可从deepseek官网下载模型,安装插件后,即可实现图像反推功能。

    两插件使用效果显著,对图像识别和描述准确,反推文本适用于SDXL模型,与原图相似度高。示例中展示了宝石匕首和湖心岛的反推结果,各插件均能准确描述图像内容。

    围绕deepseek的争吵和网络攻击,都是怎么回事,简单做几个解释

    江西原创原创标注系作者主动申请,作者保证其发布作品系原创,如存在侵权,请联系平台处理。

    这几天一直有人问我,如何评价中美围绕deepseek的网络攻防战,如何看有人说deepseek用了经过蒸馏的知识库。

    那我简单说一点。

    首先deepseek的先进性是不容质疑的,倒不是说它谈什么都准。它的优势在于它架构。打个比方,这类似人脑聪明不聪明的问题。比如有的人逻辑能力很强,擅长触类旁通,擅长举一反三,擅长归纳总结,能高效利用信息碎片整合到自己的知识体系框架里。

    有的人,先天性脑子不好用,逻辑能力很差,让他到处收集信息,给他信息让他看,让他读能做到,让他分析处理信息就没戏,让他读个名词他都读不明白,能把红外焦平面阵,读成红外焦-平面阵,说明他的脑子处理文字信息的时候,不懂红外是个概念,焦平面阵是个术语,他更熟悉的外焦里嫩这个层级的概念。

    还有人说deepseek用的是蒸馏过的知识库,以此攻击deepseek,那么什么叫蒸馏啊,我们再简单打个不算太严格,但是好懂的比喻,如果架构是脑子好不好的问题,那么蒸馏就是教材好不好的问题。孩子从小到大,从小学到大学,数学物理化学生物这些课程的教材,都是人类几千年发展下来经过积累沉淀,去伪存真之后形成的的知识,老师教学生学,学懂了会用了,就不容易走偏。这其实就类似人工智能深度学习中的蒸馏。如果没有蒸馏,那就把各种信息,有用的没用的真的假的一股脑扔给学生,也不说哪个对哪个错,让学生自己去看去练去试。两个同样聪明的学生,一个用系统性教材,另一个接受泥沙俱下的海量信息,后者不依赖巨大算力会累死。

    还有,什么叫污染?AI也是要被训练的,你问它一个问题,它给你一个答案,你说这个答案不满意不对,要它修改,有的AI会说好的,然后修改到用户满意为止。如果有一大批用户用假信息去训练AI,AI就会被错误信息彻底带偏,成了人工智障。现在国内几个网络平台上,已经形成了一种高度统一认识,只要看见哪飞机出事,就一体化认定是中国电子战把别国飞机的雷达和电子设备烧冒烟了,这就是一个连物理学都违背的虚假概念,造成全社会智力污染的现实例子。和国外的网络攻击相比,国内这种智障污染的危险,很快会对AI构成破坏效应,导致AI陷入虚构现实,那就真废了。这方面国内某些人比美国还努力。

    再说美国的攻击,现在网上一堆人说360在美国黑客电脑上播放大悲咒,放360桌面还删不干净,其实就是当初有人讲电子战,说中国的雷达给美军舰艇播放喜羊羊那个爽文谣言的新版本。能有这种说法的人,根本就没学过电子战或者网络攻防是怎么回事,把不同类型系统和不同的攻击混为一谈。这就仅仅相当于几十年前地铁、火车站上上贩卖地摊小报的商贩,一张嘴就是:最新消息刘德华被车撞死了。所以说这种信息污染的技能,没准也是祖传。

    360其实已经说得够清楚,这次最主要是恶意访问,说白了就是用大量的流量,把deepseek的服务器累趴下,让真正的用户无法使用,这叫DDoS攻击。网络生活中也有类似现象,就是各种网暴、舆论攻击去占领整个网络舆论环境。

    目的都一样,这类攻击都是要破坏中国的发展,让某些利益集团继续垄断获利。

    【WINDRISES MINIPROGRAM PROMOTION】尊享直接对接老板

    电话+V: 159999-78052

    专注于小程序推广配套流程服务方案。为企业及个人客户提供了高性价比的运营方案,解决小微企业和个体拓展客户的问题

    deepseek能帮我们做什么
    发布人:q16502454 发布时间:2025-02-06