news 2026/4/22 23:01:45

使用豆包多模态API(doubao-seed-1-8模型)分析小红书视频内容pyhton代码

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
使用豆包多模态API(doubao-seed-1-8模型)分析小红书视频内容pyhton代码

爬虫任务

有一个爬取小红书上视频内容并且分析的任务,下面是一个简单可以运行的demo。

注意加载环境变量,这里的.env表示读取相同路径下.env里面的ARK_API_KEY

import os from volcenginesdkarkruntime import Ark from dotenv import load_dotenv # 加载环境变量 env_path=os.path.join(os.path.dirname(__file__),'.env')load_dotenv(env_path)# 初始化豆包客户端 client=Ark(base_url='https://ark.cn-beijing.volces.com/api/v3',api_key=os.getenv('ARK_API_KEY'),)# 测试视频URL video_url="http://sns-video-hs.xhscdn.com/stream/1/110/259/01e95ce6da070f66010370039b92e65e08_259.mp4"response=client.responses.create(model="doubao-seed-1-8-251228",input=[{"role":"user","content":[{"type":"input_video","video_url":video_url,"fps":1},{"type":"input_text","text":"请详细描述这个视频的内容。"}],}])print("="*80)print("响应对象类型:",type(response))print("="*80)print("\n响应对象属性:")forattr indir(response):ifnot attr.startswith('_'):try:value=getattr(response,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passprint("\n"+"="*80)print("response.output 结构:")print("="*80)ifhasattr(response,'output')and response.output:print(f"output 类型: {type(response.output)}")print(f"output 长度: {len(response.output)}")fori,item inenumerate(response.output):print(f"\noutput[{i}] 类型: {type(item)}")print(f"output[{i}] 属性:")forattr indir(item):ifnot attr.startswith('_'):try:value=getattr(item,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passifhasattr(item,'content')and item.content:print(f"\n content 类型: {type(item.content)}")print(f" content 长度: {len(item.content)}")forj,content_item inenumerate(item.content):print(f"\n content[{j}] 类型: {type(content_item)}")print(f" content[{j}] 属性:")forattr indir(content_item):ifnot attr.startswith('_'):try:value=getattr(content_item,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passelse:print("response.output 为空或不存在")print("\n"+"="*80)print("尝试提取文本:")print("="*80)try:ifresponse.output andlen(response.output)>0:output_msg=response.output[0]ifhasattr(output_msg,'content')and output_msg.content:forcontent in output_msg.content:ifhasattr(content,'text'):print(f"找到文本: {content.text[:200]}...")breakexcept Exception as e:print(f"提取失败: {e}")

提取的内容为:

output[1] 类型: <class ‘volcenginesdkarkruntime.types.responses.response_output_message.ResponseOutputMessage’>
output[1] 属性:
content: list = [ResponseOutputText(type=‘output_text’, text=‘这个视频是小红书平台的趣味内容,围绕“图书馆的桌子怎么搬进来”展开,内容分段如下:\n\n0-4秒:画面呈现图书馆学习区域,前景是摆满学习用品的桌面——写有笔记的本子、黄色边框平板、咖啡杯、卡通图案笔筒、白色鼠标等,背景有一位女生在整理物品;配文和顶部标题接连抛出疑问:“你们说图书馆这么多张桌子”“真的是一张一张搬进来的吗?”“图书馆这么多桌子咋搬进来的”。\n\n5-6秒:切换到评论区,展示第一条网友评论:“不学你就回宿舍”,发布地为山东,获2091个赞,可展开81条回复,下方同步配有对应字幕。\n\n7-9秒:展示第二条评论:“不想学把手机电脑平板充满电就回宿舍吧”(附带彩虹表情),发布地为上海,获5.4万赞,可展开625条回复;中间插入吐舌头的猫猫表情包,配文字“嘿嘿嘿”,呼应评论的调侃语气。\n\n10-13秒:展示第三条评论:“宿舍门这么小 床又是怎么搬进来的”(搭配带问号的白色小人表情包),发布地为广东,获2164个赞;下方还有一条搞笑回复:“床小时候搬进来的”,延续趣味调侃的风格。\n\n14-17秒:展示第四条评论:“搬一个,然后啃臭加v啃臭加c复制粘贴”,是电脑快捷键“Ctrl+C、Ctrl+V”的谐音梗,发布地为湖北,获2442个赞,可展开46条回复;最后画面是两个紧挨的仓鼠脸表情包,右上角配有红色问号图案,为视频收尾,强化搞笑氛围。\n\n整个视频通过“提出疑问+展示神评论”的形式,借网友的幽默回复制造笑点,风格轻松有趣。’, annotations=None)]
id: str = msg_02176839283688100000000000000000000ffffac1531daa551d8
model_computed_fields: dict = {}
model_config: dict = {‘extra’: ‘allow’, ‘defer_build’: True, ‘protected_namespaces’: ()}
model_extra: dict = {}

后记

2026年1月14日于上海,周三。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 23:13:54

SAM3智能修图实战:云端PS插件,设计师效率神器

SAM3智能修图实战&#xff1a;云端PS插件&#xff0c;设计师效率神器 你是不是也遇到过这样的情况&#xff1f;影楼修图师每天要处理上百张人像照片&#xff0c;光是抠图就占了大半时间。传统的Photoshop手动钢笔工具太慢&#xff0c;AI插件又卡得不行——尤其是你那台老款笔记…

作者头像 李华
网站建设 2026/4/18 21:40:46

本地大模型如何接入opencode?Ollama+Qwen3-4B部署教程

本地大模型如何接入opencode&#xff1f;OllamaQwen3-4B部署教程 1. 背景与技术选型 随着 AI 编程助手的普及&#xff0c;开发者对隐私保护、模型灵活性和本地化运行的需求日益增长。OpenCode 作为 2024 年开源的终端优先 AI 编程框架&#xff0c;凭借其“任意模型、零代码存…

作者头像 李华
网站建设 2026/4/17 5:12:56

语音合成模型压缩实战:CosyVoice-300M Lite技术

语音合成模型压缩实战&#xff1a;CosyVoice-300M Lite技术 1. 引言 随着智能语音助手、有声读物、虚拟主播等应用的普及&#xff0c;高质量、低延迟的文本到语音&#xff08;Text-to-Speech, TTS&#xff09;系统已成为AI落地的关键环节。然而&#xff0c;传统TTS模型往往参…

作者头像 李华
网站建设 2026/4/17 17:55:26

汽车维修:技师诊断过程语音记录与知识沉淀

汽车维修&#xff1a;技师诊断过程语音记录与知识沉淀 在汽车后市场服务中&#xff0c;维修技师的经验是企业最宝贵的无形资产。然而&#xff0c;这些经验往往依赖于口耳相传或零散的纸质记录&#xff0c;难以系统化沉淀和复用。随着人工智能技术的发展&#xff0c;尤其是离线…

作者头像 李华
网站建设 2026/4/22 11:07:32

AI智能文档扫描仪技术栈解析:OpenCV几何变换应用实例

AI智能文档扫描仪技术栈解析&#xff1a;OpenCV几何变换应用实例 1. 技术背景与应用场景 在移动办公和数字化管理日益普及的今天&#xff0c;将纸质文档快速转化为高质量电子文件成为高频需求。传统扫描仪依赖专用硬件&#xff0c;而手机拍照虽便捷却存在角度倾斜、透视畸变、…

作者头像 李华
网站建设 2026/4/22 4:04:02

快速迭代:如何用云端环境加速DCT-Net产品开发周期

快速迭代&#xff1a;如何用云端环境加速DCT-Net产品开发周期 你是否也遇到过这样的情况&#xff1f;团队正在全力推进AI卡通化功能的版本更新&#xff0c;结果每次新成员加入或测试环境重建时&#xff0c;都要花上半天甚至一整天去配置Python环境、安装CUDA驱动、调试PyTorch…

作者头像 李华