使用python如何提取JSON数据指定内容

 更新时间:2022年07月06日 14:29:25   作者:hrflex  
这篇文章主要介绍了使用python如何提取JSON数据指定内容,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
(福利推荐:【腾讯云】服务器最新限时优惠活动,云服务器1核2G仅99元/年、2核4G仅768元/3年,立即抢购>>>:9i0i.cn/qcloud

(福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun

如何提取JSON数据指定内容

假设我们要获取'pic_str'里的数据

JSON数据

{'err_no': 0, 'err_str': 'OK', 'pic_id': '1169213517976400008', 'pic_str': 'xoet', 'md5': 'ca9bc4fda521498d2b3aba5dbb4ee4ac'}

1、JSON数据为字符串类型

import json
?
str = "{'err_no': 0, 'err_str': 'OK', 'pic_id': '1169213517976400008', 'pic_str': 'xoet', 'md5': 'ca9bc4fda521498d2b3aba5dbb4ee4ac'}"
json_str = str.replace("'",'"')
# json.loads() ,要求json串格式中必须的双引号!!转换为字典
json_dict = json.loads(dict2)
print(json_dict['pic_str'])
>> xoet

2、JSON数据为字典类型

import json
?
json_dict = {'err_no': 0,'err_str': 'OK', 'pic_id': '1169213517976400008', 'pic_str': 'xoet', 'md5': 'ca9bc4fda521498d2b3aba5dbb4ee4ac'}
# 方法一
print(json_dict['pic_str'])
# 或者使用 print(json_dict.get('pic_str'))
?
# 方法二:遍历
for pic in json_dict['pic_str'}:
? ? print(pic)

如何提取复杂JSON的数据 

在越来越多的项目中,基本都用了 json 作为接口数据返回的格式。json 给我们的感觉就是通俗易懂,只是即使再复杂的结构也会比其他格式容易看。然而一旦在调试或者测试中需要用到提取某一部分字段数据进行解析并校验的话,就没那么容易了。这篇文章使用 python 简单地获取到复杂 json 数据中的字段信息。

例子

如果有一个接口返回的 json 信息如下:

{
? "familyName": "thinker family",
? "homeTown": "广东省",
? "formed": 2016,
? "secretBase": "Super city",
? "active": true,
? "familyMembers": [
? ? {
? ? ? "name": "Jobs",
? ? ? "age": 35,
? ? ? "secretIdentity": "1992238132345",
? ? ? "powers": [
? ? ? ? "Radiation resistance",
? ? ? ? "Turning tiny",
? ? ? ? "Radiation blast"
? ? ? ]
? ? },
? ? {
? ? ? "name": "James",
? ? ? "age": 37,
? ? ? "secretIdentity": "8839394098124",
? ? ? "powers": [
? ? ? ? "Million tonne punch",
? ? ? ? "Damage resistance",
? ? ? ? "Superhuman reflexes"
? ? ? ]
? ? }
? ]
}

这里就包含了对象,以及列表数据。对象中也包含列表数据。这应该是最基本的企业接口 json 格式了。

假如你要提取 json 中的 name 信息,最简单的方式就是

member = [ members.get('name') for members in data.get('familyMembers') ]

如果是要连续拿其他的信息,那么就需要换其他中获取方式,其实这种是比较麻烦的一种方法。

解决方法

extract_element_from_json(data, ["familyMembers", "name"])
>> ['Jobs', 'James']

此函数根据 path 中指定的键嵌套到obj中的记录中以检索所需的信息。当遇到一个列表作为 path 中键的值时,此函数会拆分并以深度优先的方式继续嵌套在遇到的列表的每个元素上。这就是返回 ['Jobs', 'James'] 的方式;因为 familyMembers 的值是一个列表,所以嵌套在它的两个元素上被拆分,并且 name 的每个值都附加到输出列表中。

如果 obj 是单个字典/ json,则此函数返回包含所需信息的列表,如果 obj 是字典/ json 列表,则此函数返回包含所需信息的双重列表。

如果嵌套字典/ json 的相应级别缺少 path 的元素,则此函数返回 [None]。

完整代码如下: 

def extract_element_from_json(obj, path):
    '''
    输入关键字,就可以将关键字的值信息存放在列表中并输出
    如果关键字是对象名,则返回的对象字典信息到列表中
    如果关键字是列表名,则返回的列表信息到列表中(返回双重列表)
    '''
    def extract(obj, path, ind, arr):
    	'''
    	从一个嵌套的字典中提取一个元素,并返回到列表中。
        params: obj - dict - 输入字典
        params: path - list - 构成JSON路径的字符串列表
        params: ind - int - 起始索引
        params: arr - 列表 - 输出列表
    	'''
        key = path[ind]
        if ind + 1 < len(path):
            if isinstance(obj, dict):
                if key in obj.keys():
                    extract(obj.get(key), path, ind + 1, arr)
                else:
                    arr.append(None)
            elif isinstance(obj, list):
                if not obj:
                    arr.append(None)
                else:
                    for item in obj:
                        extract(item, path, ind, arr)
            else:
                arr.append(None)
        if ind + 1 == len(path):
            if isinstance(obj, list):
                if not obj:
                    arr.append(None)
                else:
                    for item in obj:
                        arr.append(item.get(key, None))
            elif isinstance(obj, dict):
                arr.append(obj.get(key, None))
            else:
                arr.append(None)
        return arr
    if isinstance(obj, dict):
        return extract(obj, path, 0, [])
    elif isinstance(obj, list):
        outer_arr = []
        for item in obj:
            outer_arr.append(extract(item, path, 0, []))
        return outer_arr

这段代码可以直接复制使用。

其中使用方法很简单如下:

extract_element_from_json(data, ["familyMembers", "name"])

api 提取元素

import requests
url = "http://ip-api.com/json"
response = requests.request("GET", url)
data = response.json()
extract_element_from_json(data, ["status"])

就是这么简单地使用了。

应用场景

通过这样的方式可以在什么场景下使用呢?

  • 接口重构,需要校验接口中的部分字段数据
  • 接口新增字段,只针对新增的字段进行提取校验
  • 需要提取某一部分字段进行数据传递

以上为个人经验,希望能给大家一个参考,也希望大家多多支持程序员之家。

相关文章

  • 简单了解python的内存管理机制

    简单了解python的内存管理机制

    这篇文章主要介绍了简单了解python的内存管理机制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • OpenCV+MediaPipe实现手部关键点识别

    OpenCV+MediaPipe实现手部关键点识别

    这篇文章主要介绍了如何通过OpenCV MediaPipe实现手部关键点识别,文中的示例代码讲解详细,对我们学习或工作有一定的价值,需要的可以参考一下
    2022-01-01
  • python使用plot绘制未来15天气温折线图

    python使用plot绘制未来15天气温折线图

    本文主要介绍了py使用plot绘制未来15天气温折线图,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-09-09
  • Python补齐字符串长度的实例

    Python补齐字符串长度的实例

    今天小编就为大家分享一篇Python补齐字符串长度的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • python 哈希表实现简单python字典代码实例

    python 哈希表实现简单python字典代码实例

    这篇文章主要介绍了python 哈希表实现简单python字典代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • LyScript实现Hook隐藏调试器的方法详解

    LyScript实现Hook隐藏调试器的方法详解

    LyScript?插件集成的内置API函数可灵活的实现绕过各类反调试保护机制。本文将运用LyScript实现绕过大多数通用调试机制,实现隐藏调试器的目的,需要的可以参考一下
    2022-09-09
  • Python两台电脑实现TCP通信的方法示例

    Python两台电脑实现TCP通信的方法示例

    这篇文章主要介绍了Python两台电脑实现TCP通信的方法示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05
  • 利用Python读取Excel表内容的详细过程

    利用Python读取Excel表内容的详细过程

    python有多种方式可以去读取excel文档的内容,下面这篇文章主要给大家介绍了利用Python读取Excel表内容的详细过程,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-10-10
  • 用Python和MD5实现网站挂马检测程序

    用Python和MD5实现网站挂马检测程序

    系统管理员通常从svn/git中检索代码,部署站点后通常首先会生成该站点所有文件的MD5值,如果上线后网站页面内容被篡改(如挂马)等,可以比对之前生成MD5值快速查找去那些文件被更改,为了使系统管理员第一时间发现,可结合crontab或nagios等工具
    2014-03-03
  • Python?OpenCV超详细讲解调整大小与图像操作的实现

    Python?OpenCV超详细讲解调整大小与图像操作的实现

    OpenCV用C++语言编写,它具有C?++,Python,Java和MATLAB接口,并支持Windows,Linux,Android和Mac?OS,OpenCV主要倾向于实时视觉应用,并在可用时利用MMX和SSE指令,本篇文章带你通过OpenCV实现重调大小与图像裁剪
    2022-04-04

最新评论

?


http://www.vxiaotou.com