simplejson处理不严谨JSON一例

December 2010 · 1 minute read

一个标准、严谨的JSON应该如下:

<code>{"title": "\u6587\u7ae0\u6807\u9898\n\u6362\u884c"}
</code>

但是在某些情况下,特别是跨语言情况下,JSON可能是这个样子:

<code>{"title": "文章标题
换行"}
</code>

这种情况下直接使用 simplejson.loads(json) 有可能报如下错误:

<code>Traceback (most recent call last):
  File "testjson.py", line 24, in <module>
    print simplejson.loads(json)
  File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/
site-packages/PIL/__init__.py", line 384, in loads

  File "build/bdist.macosx-10.5-i386/egg/simplejson/decoder.py", line 402, 
in decode
  File "build/bdist.macosx-10.5-i386/egg/simplejson/decoder.py", line 418, 
in raw_decode
simplejson.decoder.JSONDecodeError: Invalid control character at: line 1 
column 15 (char 15)
</code>

simplejson.loads() 有一个手册上没有提及的参数“strict”,这其实是 JSONDecoder 的一个构造参数,即不严格检查JSON语法。

因此,兼容非标准格式的方法即:

<code>simplejson.loads(json, strict=False)
</code>