php怎么取字符串里的数组_php字符串取数组json_decode与正则匹配法【技巧】

1次阅读

需根据字符串格式选择对应方法:一、标准jsON用json_decode;二、嵌套在非JSON中用正则提取后解析;三、php数组语法先替换再解析;四、可信环境可用eval;五、序列化字符串用unserialize。

php怎么取字符串里的数组_php字符串取数组json_decode与正则匹配法【技巧】

如果php字符串中包含类似数组格式的JSON数据,需要将其转换为可操作的PHP数组,则需根据字符串的具体结构选择合适的方法。以下是几种可行的操作步骤:

一、使用json_decode解析标准JSON字符串

当字符串是合法的JSON格式(如{“name”:”test”,”items”:[1,2,3]}),可直接调用json_decode函数将其转为关联数组对象。该方法要求字符串严格符合JSON语法规范,否则会返回NULL且不报错。

1、确认字符串以花括号{或方括号[开头,并以对应符号结尾。

2、使用json_last_error()检查解码前后的错误状态,确保无语法错误。

立即学习PHP免费学习笔记(深入)”;

3、调用json_decode($str, true)将JSON字符串转为关联数组,第二个参数设为true避免返回对象。

4、若字符串外层被单引号或多余字符包裹,需先用trim()去除首尾空白及引号。

二、用正则匹配提取嵌套在非JSON上下文中的数组结构

当字符串并非完整JSON,而是混杂在html、日志或模板代码中(例如var data = [1,2,3]; 或 $arr = Array(1,2,3);),需借助正则表达式定位并捕获目标数组部分,再进行后续处理。

1、编写正则模式匹配方括号包围的数组内容,例如’/[.*?]/s’用于懒惰匹配最短的数组字面量。

2、使用preg_match_all获取所有匹配项,选取第一个有效结果。

3、对提取出的子字符串再次调用json_decode,前提是其内容为JSON兼容格式;否则需进一步替换PHP数组语法(如array(1,2))为JSON格式。

4、若匹配到的是PHP原生数组语法,可用str_replace将array(替换为[,将)替换为],再清理空格和换行后尝试json_decode。

三、结合str_replace与json_decode处理PHP数组语法字符串

针对明确以PHP数组语法书写的字符串(如”array(1, ‘a’, array(‘x’=>2))”),无法直接用json_decode解析,需先做语法转换。该方法适用于已知字符串结构固定、无动态嵌套变量的场景。

1、用str_replace将array(替换为[,将)替换为],将=>替换为:,单引号替换为双引号。

2、对字符串中的字符串值做转义处理,例如将””替换为””,避免JSON解析失败。

3、使用preg_replace处理多维嵌套中的逗号与括号关系,确保结构闭合。

4、执行json_decode前,用json_validate(PHP 8.3+)或手动校验括号配对数量,防止非法输入导致静默失败。

四、使用eval执行动态PHP代码(仅限可信环境)

当字符串完全符合php语法且来源绝对可信(如配置文件、内部生成字符串),可临时启用eval将字符串作为PHP代码执行。此方式风险极高,禁止用于用户输入或外部数据。

1、确认字符串仅含数字、字母、空格、括号、引号、逗号、冒号、分号等安全字符。

2、在eval前添加白名单校验,例如用preg_match(‘/^[a-zA-Z0-9s[]{}():,'”.;-+*/%&|^!~=?$#]+$/’, $str)粗略过滤。

3、将字符串包装为赋值语句:$temp = $str;,再传入eval执行。

4、执行后检查$temp是否为数组类型,使用is_array($temp)验证结果有效性。

五、利用serialize/unserialize还原PHP序列化字符串

若原始字符串是PHP serialize()输出的结果(如”a:3:{i:0;i:1;i:1;i:2;i:2;i:3;}”),应优先使用unserialize而非json_decode。该方法保留PHP原生类型和结构,无需语法转换。

1、检测字符串是否以字母开头且含冒号和分号组合,例如/^([aOCS]):/匹配序列化标识符

2、使用@unserialize($str)执行反序列化,加@抑制警告,随后用is_array()判断结果。

3、若存在对象反序列化风险,设置unserialize_callback_func限制可实例化的类名。

4、对不可信数据,改用igbinary_unserialize(需扩展支持)或先校验字符串哈希签名再解包。

text=ZqhQzanResources