Python JSON解析:避免TypeError,正确访问字典键值

24次阅读

Python JSON解析:避免TypeError,正确访问字典键值

本文深入探讨了在python中解析json数据并从字典中提取特定键值对时常见的`typeerror: String indices must be integers, not ‘str’`错误。通过分析错误的根源——误将字典键名作为字典本身进行索引,教程将指导读者如何正确地通过直接键访问方式,高效且准确地从json解析后的python字典中提取所需信息,从而避免常见的迭代陷阱。

在Python中处理API响应或配置文件时,jsON数据是极其常见的格式。我们通常使用json.loads()方法将JSON字符串转换为Python字典,然后从中提取所需信息。然而,在这个过程中,一个常见的错误是尝试以不正确的方式迭代和访问字典元素,从而导致TypeError: string indices must be integers, not ‘str’。本教程将详细解释这一错误发生的原因,并提供正确的解决方案。

理解TypeError:字符串索引的误区

当从API获取响应并使用json.loads()将其转换为Python字典后,我们可能会尝试遍历这个字典来提取特定的键值对。考虑以下示例代码片段,它展示了一个常见的错误模式:

import requests import json  def get_user_id_problematic(user):     api_url = "https://api.sleeper.app/v1/user/" + user     response = requests.get(api_url)      # 检查请求是否成功     response.raise_for_status()       user_data_str = response.content.decode("UTF-8")     user_data = json.loads(user_data_str)      user_ids = []     # 错误的迭代方式:user_data是一个单一字典,而非列表     for i in user_data:         # 尝试使用字符串i作为字典键来索引自身,导致TypeError         # 例如,当i是"username"时,会执行"username"["username"],这是无效的         user_ids.append({'username': i["username"], 'user_id': i["user_id"]})     return user_ids  # 假设 user_data 的实际结构是一个包含所有用户信息的单一字典: # user_data = { #     'verification': None, #     'username': 'zeustrl', #     'user_id': '766368574179770368', #     'token': None, #     # ... 其他键值对 # }

当执行上述for i in user_data:循环时,变量i在每次迭代中实际上代表的是字典user_data的一个键名(即字符串)。例如,在第一次迭代中,i可能是”verification”;在第二次迭代中,i是”username”,以此类推。

为了更好地理解这一点,我们可以修改循环内容如下:

立即学习Python免费学习笔记(深入)”;

# 假设 user_data 已被正确加载为一个字典 # user_data = {'username': 'zeustrl', 'user_id': '766368574179770368', ...} for i in user_data:     print(f"类型: {type(i)}, 值: {i}")

输出将是:

类型: <class 'str'>, 值: verification 类型: <class 'str'>, 值: username 类型: <class 'str'>, 值: user_id # ...

这清楚地表明,i是一个字符串。因此,当代码尝试执行i[“username”]时,它实际上是在尝试用字符串”username”去索引另一个字符串i(例如,当i是”username”时,它会变成”username”[“username”];当i是”user_id”时,它会变成”user_id”[“username”])。Python字符串只能通过整数索引(例如”username”[0]会得到’u’),而不能通过字符串索引,这就导致了TypeError: string indices must be integers, not ‘str’。

正确访问字典键值

根据提供的user_data示例,它是一个单一的字典,包含了所有用户的详细信息,而不是一个包含多个用户字典的列表。因此,我们无需迭代整个字典来获取username和user_id。可以直接通过键名访问这些值。

Python JSON解析:避免TypeError,正确访问字典键值

Find JSON Path Online

Easily find JSON paths within JSON objects using our intuitive Json Path Finder

Python JSON解析:避免TypeError,正确访问字典键值30

查看详情 Python JSON解析:避免TypeError,正确访问字典键值

正确的做法是直接从user_data字典中提取所需的键值:

import requests import json  def get_user_info(user):     """     通过API获取用户信息,并提取username和user_id。     参数:         user (str): 目标用户的用户名。     返回:         dict: 包含'username'和'user_id'的字典。     抛出:         requests.exceptions.RequestException: 如果API请求失败。         json.JSONDecodeError: 如果API响应不是有效的JSON。         KeyError: 如果响应字典中缺少'username'或'user_id'键。     """     api_url = "https://api.sleeper.app/v1/user/" + user     response = requests.get(api_url)      # 检查请求是否成功,如果状态码不是200,则抛出HTTPError     response.raise_for_status()       user_data_str = response.content.decode("UTF-8")     user_data = json.loads(user_data_str)      # 直接从字典中访问所需键值     # 这假设'username'和'user_id'键一定存在于user_data中     username = user_data["username"]     user_id = user_data["user_id"]      return {"username": username, "user_id": user_id}  # 示例使用 if __name__ == "__main__":     # 假设 'zeustrl' 是一个有效的用户名     target_user = "zeustrl"       try:         user_details = get_user_info(target_user)         print(f"获取到的用户详情: {user_details}")          # 如果需要将多个用户的信息收集到一个列表中,可以在外部调用并添加         user_ids_list = []         user_ids_list.append(user_details)         print(f"用户ID列表: {user_ids_list}")          # 假设有另一个用户         # another_user_details = get_user_info("another_user_name")         # user_ids_list.append(another_user_details)         # print(f"更新后的用户ID列表: {user_ids_list}")      except requests.exceptions.RequestException as e:         print(f"请求API时发生错误: {e}")     except json.JSONDecodeError as e:         print(f"JSON解析错误: {e}")     except KeyError as e:         print(f"字典中缺少预期的键: {e}")     except Exception as e:         print(f"发生未知错误: {e}")

在这个修正后的get_user_info函数中,我们直接使用user_data[“username”]和user_data[“user_id”]来访问字典中对应的值。这避免了不必要的迭代,并且是访问单个字典元素最直接和正确的方式。

注意事项与最佳实践

  1. 直接访问与迭代的区别:

    • 当json.loads()返回的是一个包含所有所需信息的单个字典时,应直接通过键名访问(例如data[“key”])。
    • 当json.loads()返回的是一个包含多个字典的列表时(例如[{‘user’: ‘A’}, {‘user’: ‘B’}]),才需要迭代这个列表,然后对列表中的每个字典进行键访问(例如for item in data_list: item[“key”])。
    • 如果确实需要迭代字典的键和值,可以使用dict.items()方法,例如for key, value in user_data.items(): print(f”{key}: {value}”)。
  2. 错误处理:

    • 在访问字典键之前,最好检查键是否存在,以避免KeyError。可以使用dict.get(key, default_value)方法,它会在键不存在时返回一个默认值而不是抛出错误。
      username = user_data.get("username", "未知用户名") user_id = user_data.get("user_id", None) # 如果不存在,user_id将为None
    • 处理网络请求(requests.exceptions.RequestException)和JSON解析(json.JSONDecodeError)可能出现的异常,以提高程序的健壮性。
  3. API响应结构:

    • 在处理API响应时,始终首先了解其返回的JSON数据结构。这有助于确定是直接访问、迭代列表还是迭代嵌套字典。阅读API文档是关键一步。

总结

TypeError: string indices must be integers, not ‘str’错误通常源于对Python字典迭代机制的误解。当for i in some_dict:时,i是字典的键(字符串),而不是字典本身或其值。对于从JSON解析得到的单个字典,最直接且正确的方式是使用键名进行直接访问,例如dictionary[“key”]。理解并应用这一原则,将有助于您更高效、更准确地处理Python中的JSON数据。

text=ZqhQzanResources