全球主机交流论坛备用站

 找回密码
 立即注册

QQ登录

只需一步,快速开始

全球云38元起免备案V2EX搬瓦工VPS
SEO查询超级PING网站测速
Virmach特价鸡乌云漏洞吾爱破解
查看: 134|回复: 7

python大佬请进,关于抓取的数据格式的问题

[复制链接]

30

主题

339

帖子

1028

积分

金牌会员

Rank: 6Rank: 6

积分
1028
发表于 2023-9-18 00:17:50 | 显示全部楼层 |阅读模式
20230417
最近百度上线的chat  https://chat.baidu.com/

想自己套个壳玩玩,原打算是用PHP的,但是因为这个结果是流数据,PHP的curl貌似搞不定,只好转到python

代码已完成90%

baidu.rar (1.24 KB, 下载次数: 8)

代码运行成功,也有返回数据

但返回的数据都是这种格式

C:\>python baidu.py
请求成功
event:ping

event:message
data:{"status":0,"qid":"12643291455431891488","pkgId":"cd971053-9663-4d88-8a54-2
c428ddbf3b7_0","sessionId":"43d95fc2-b94f-442f-9c5b-b8078f712862","isDefault":1,
"isShow":0,"data":{"message":{"msgId":"cd971053-9663-4d88-8a54-2c428ddbf3b7","is
Rebuild":false,"updateTime":"1694966929746","metaData":{"state":"waiting-resp","
endTurn":false,"userInfo":{"status":3}},"content":{}}}}


event:message
data:{"status":0,"qid":"12643291455431891488","pkgId":"cd971053-9663-4d88-8a54-2
c428ddbf3b7_1","sessionId":"43d95fc2-b94f-442f-9c5b-b8078f712862","isDefault":1,
"isShow":0,"data":{"message":{"msgId":"cd971053-9663-4d88-8a54-2c428ddbf3b7","is
Rebuild":false,"updateTime":"1694966933900","metaData":{"state":"waiting-resp","
endTurn":false,"userInfo":{"status":3}},"content":{"searchQuery":{"querys":["鲁
迅是谁"]}}}}}


event:message
data:{"status":0,"qid":"12643291455431891488","pkgId":"cd971053-9663-4d88-8a54-2
c428ddbf3b7_2","sessionId":"43d95fc2-b94f-442f-9c5b-b8078f712862","isDefault":1,
"isShow":0,"data":{"message":{"msgId":"cd971053-9663-4d88-8a54-2c428ddbf3b7","is
Rebuild":false,"updateTime":"1694966933978","metaData":{"state":"generating-resp
","endTurn":false,"userInfo":{"status":3}},"content":{"generator":{"text":"鲁迅
,原名周樟","type":"txt","showType":"append","antiFlag":0,"isFinished":false}}}}
}


event:message
data:{"status":0,"qid":"12643291455431891488","pkgId":"cd971053-9663-4d88-8a54-2
c428ddbf3b7_3","sessionId":"43d95fc2-b94f-442f-9c5b-b8078f712862","isDefault":1,
"isShow":0,"data":{"message":{"msgId":"cd971053-9663-4d88-8a54-2c428ddbf3b7","is
Rebuild":false,"updateTime":"1694966934570","metaData":{"state":"generating-resp
","endTurn":false,"userInfo":{"status":3}},"content":{"generator":{"text":"寿,
后改名周树人,字豫山,后改字豫才,是浙江绍兴的人。","type":"txt","showType":"app
end","antiFlag":0,"isFinished":false}}}}}

请问怎么才能把需要的text内容提取出来,组成完整的答案?

求大佬指教
MJJ,你的签名掉了~~~
回复

使用道具 举报

9

主题

803

帖子

2381

积分

金牌会员

Rank: 6Rank: 6

积分
2381
发表于 2023-9-18 00:21:20 | 显示全部楼层
正则万能,你这个格式我前两天刚处理过,把内容交给ai让他给你写正则表达式就好了
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

143

主题

1061

帖子

2663

积分

金牌会员

Rank: 6Rank: 6

积分
2663
发表于 2023-9-18 00:24:42 | 显示全部楼层
本帖最后由 BackDoor 于 2023-9-18 00:27 编辑

python 有  json库直接输出的。

parsed_data['data']['message']['content']['generator']['text']

MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

30

主题

339

帖子

1028

积分

金牌会员

Rank: 6Rank: 6

积分
1028
 楼主| 发表于 2023-9-18 00:31:15 | 显示全部楼层
taiyi747 发表于 2023-9-18 00:21
正则万能,你这个格式我前两天刚处理过,把内容交给ai让他给你写正则表达式就好了 ...

谢谢大佬,没想到呢,一直想着json解析
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

30

主题

339

帖子

1028

积分

金牌会员

Rank: 6Rank: 6

积分
1028
 楼主| 发表于 2023-9-18 00:21:00 | 显示全部楼层
BackDoor 发表于 2023-9-18 00:24
python 有  json库直接输出的。

parsed_data['data']['message']['content']['generator']['text']

好的,谢谢大佬
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

7

主题

56

帖子

195

积分

注册会员

Rank: 2

积分
195
发表于 2023-9-18 01:03:09 | 显示全部楼层
json.loads()
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

23

主题

258

帖子

869

积分

高级会员

Rank: 4

积分
869
发表于 2023-9-18 00:24:00 | 显示全部楼层
这不就是JSON?
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

24

主题

448

帖子

1116

积分

金牌会员

Rank: 6Rank: 6

积分
1116
发表于 2023-9-18 01:42:58 | 显示全部楼层
这是py的json基础问题呀,你的头像有点花里胡哨呀
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

展开

QQ|Archiver|手机版|小黑屋|全球主机交流论坛备用站

GMT+8, 2024-6-1 21:37 , Processed in 0.045593 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表