初步了解 PHP V6 中的新特性-技术开发专区

初步了解 PHP V6 中的新特性

作者：IBM Deepak Vohra 编辑：覃里 2009-06-16 12:30 来源：IT168�

　　两种字符串类型

　　PHP V5 的字符串类型实现有很多字符串类型(二进制、字符串和 Unicode)，并且有很多内部引擎函数和帮助函数的实现。PHP V6 只有两种字符串类型：二进制和 Unicode。unicode.semantics 转换(switch)决定字符串字面量的默认类型。如果启用了 unicode.semantics，默认的字符串字面量就为 Unicode。如果禁用该语义转换，默认字符串字面量的类型就为二进制。您可以显式地在 Unicode 和二进制字符串类型之间转换，也可以隐式地进行转换。使用 unicode.runtime_encoding 配置选项进行隐式转换。表 1 显示了如何进行显式转换。

　　表 1. 转换字符串类型　　

　　PHP V6 在内部使用 IS_STRING 表示二进制字符串数据，以及使用 IS_UNICODE 表示 Unicode 字符串数据。

　　在扩展中支持 Unicode

　　PHP V6 包含了 Unicode/API，扩展可以借助它实现 Unicode 支持。需要向扩展模块结构添加一个标志，以表明它是否支持 Unicode。如果扩展不支持 Unicode，并且在 PHP 中启用了 Unicode 语义，那么在启动时将不加载它。Unicode 支持被添加到 PHP 数据对象中 (PDO)。

　　ICU 库

　　International Components for Unicode (ICU) 是一组提供 Unicode 和全球化支持的库。PHP V6 需要使用 ICU，但 ICU 是一个大型的库，将增加 PHP 的下载体积。PHP 要求使用 ICU V3.4，并且要求发布版提供 ICU 库。

　　文件名编码

　　不同的文件名可能使用不同的字符集进行编码。例如，Windows 文件名使用 UTF-16 编码。filename_encoding 设置指定期望的文件名编码。当 read 函数(比如 readdir() 和 readfile())遇到其编码在 filename_encoding 中不存在的文件名时，将返回一个二进制字符串。

　　缓存校对器

　　校对器(Collator)用于比较字符串。打开和关闭校对器需要引入开销。PHP V6 缓存了校对器，但限制存储在缓存中的对象数量，以防止使用过多的内存。PHP V6 在线程/进程通用缓存中存储最近打开的 3 个校对器。

　　基于位置的函数

　　对于使用系统位置的 PHP 函数，由于位置名在不同的平台中不一致甚至不可用，因此这是一个问题。PHP V6 仅在合适的地方使用基于位置的函数。基于位置的函数包括 strtoupper/strtolower 和 stristr 等。strtoupper 函数将字母表中的字符都转换为大写的。“字母表的字符顺序” 由当前的位置决定。

　　字符集转换错误

　　在字符编码之间执行转换可能发生转换错误，因为并不是源字符串中的所有字符都有必要存储在目标字符串中。PHP V6 为字符集转换失败提供一个额外的错误模式，它会在失败时抛出异常。PHP V6 为处理转换错误引入了两个新的 php.ini 配置选项：unicode.from_error_mode 和 unicode.from_error_subst_char。

　　unicode.from_error_mode = U_INVALID_SUBSTITUTE

　　unicode.from_error_subst_char = 3f

　　unicode.from_error_subst_char 选项为无效的字符串指定了代替字符串的十六进制值;它的默认值是 3f。

　　unicode.from_error_mode 选项指定错误模式，它在遇到无效字符串时采取行动。表 2 显示了 unicode.from_error_mode 可能使用的值。

　　表 2. unicode.from_error_mode 值

第1页：初步了解 PHP V6 中的新特性(1)第2页：初步了解 PHP V6 中的新特性(2)第3页：初步了解 PHP V6 中的新特性(3)第4页：初步了解 PHP V6 中的新特性(4)第5页：初步了解 PHP V6 中的新特性(5)第6页：初步了解 PHP V6 中的新特性(6)第7页：初步了解 PHP V6 中的新特性(7)第8页：初步了解 PHP V6 中的新特性(8)

关注我们