掌握 Python 中处理“内容”的核心方法
严格来说,Python 标准库中并没有一个名为 content() 的内置函数。但在实际开发中,特别是在使用第三方库(如 requests)时,.content 属性被广泛用于获取 HTTP 响应的原始字节内容。
本专题将围绕这一常见用法,结合文件读取等场景,帮助你全面理解“内容”在 Python 中的处理方式。
requests 库获取网页或 API 的原始响应数据import requests
response = requests.get('https://httpbin.org/html')
raw_content = response.content # 返回 bytes 类型
print(type(raw_content)) # <class 'bytes'>
print(raw_content[:100]) # 打印前100字节
with open('photo.jpg', 'rb') as f:
image_data = f.read() # 等效于“content”
print(len(image_data), 'bytes')
response.text 返回解码后的字符串,而 response.content 返回原始字节(bytes)。处理非文本资源(如图片、视频)时应使用 .content。
.text 与 .content:文本用 .text,二进制用 .content。'rb' 模式。response.status_code 是否为 200。stream=True in requests)避免内存溢出。.content 到文件时,使用二进制写入模式('wb')。虽然 Python 没有全局的 content() 函数,但通过 requests.Response.content 或文件对象的 read() 方法,我们可以高效地获取和处理各种类型的内容数据。理解字节与字符串的区别,是正确使用这些方法的关键。