|
JavaTM Platform Standard Ed. 6 |
|||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||
java.lang.Objectjava.lang.Character
public final class Character
Character 类在对象中包装一个基本类型 char 的值。Character 类型的对象包含类型为 char 的单个字段。
此外,该类提供了几种方法,以确定字符的类别(小写字母,数字,等等),并将字符从大写转换成小写,反之亦然。
字符信息基于 Unicode 标准,版本 4.0。
Character 类的方法和数据是通过 UnicodeData 文件中的信息定义的,该文件是 Unicode Consortium 维护的 Unicode Character Database 的一部分。此文件指定了各种属性,其中包括每个已定义 Unicode 代码点或字符范围的名称和常规类别。
此文件及其描述可从 Unicode Consortium 获得,网址如下:
char 数据类型(和 Character 对象封装的值)基于原始的 Unicode 规范,将字符定义为固定宽度的 16 位实体。Unicode 标准曾做过修改,以允许那些其表示形式需要超过 16 位的字符。合法代码点 的范围现在是从 U+0000 到 U+10FFFF,即通常所说的 Unicode 标量值。(请参阅 Unicode 标准中 U+n 表示法的定义。)
从 U+0000 到 U+FFFF 的字符集有时也称为 Basic Multilingual Plane (BMP)。代码点大于 U+FFFF 的字符称为增补字符。Java 2 平台在 char 数组以及 String 和 StringBuffer 类中使用 UTF-16 表示形式。在这种表现形式中,增补字符表示为一对 char 值,第一个值取自高代理项 范围,即 (\uD800-\uDBFF),第二个值取自低代理项 范围,即 (\uDC00-\uDFFF)。
所以,char 值表示 Basic Multilingual Plane (BMP) 代码点,其中包括代理项代码点,或 UTF-16 编码的代码单元。int 值表示所有 Unicode 代码点,包括增补代码点。int 的 21 个低位(最低有效位)用于表示 Unicode 代码点,并且 11 个高位(最高有效位)必须为零。除非另有指定,否则与增补字符和代理项 char 值有关的行为如下:
char 值的方法无法支持增补字符。它们将代理项字符范围内的 char 值视为未定义字符。例如,Character.isLetter('\uD840') 返回 false,即使是特定值,如果在字符串的后面跟着任何低代理项值,那么它将表示一个字母。
int 值的方法支持所有 Unicode 字符,其中包括增补字符。例如,Character.isLetter(0x2F81A) 返回 true,因为代码点值表示一个字母(一个 CJK 象形文字)。
在 Java SE API 文档中,Unicode 代码点 用于范围在 U+0000 与 U+10FFFF 之间的字符值,而 Unicode 代码点 用于作为 UTF-16 编码的代码单元的 16 位 char 值。有关 Unicode 技术的详细信息,请参阅 Unicode Glossary。
| 嵌套类摘要 | |
|---|---|
static class |
Character.Subset
此类的实例表示 Unicode 字符集的特定子集。 |
static class |
Character.UnicodeBlock
表示 Unicode 规范中字符块的一系列字符子集。 |
| 字段摘要 | |
|---|---|
static byte |
COMBINING_SPACING_MARK
Unicode 规范中的常规类别“Mc”。 |
static byte |
CONNECTOR_PUNCTUATION
Unicode 规范中的常规类别“Pc”。 |
static byte |
CONTROL
Unicode 规范中的常规类别“Cc”。 |
static byte |
CURRENCY_SYMBOL
Unicode 规范中的常规类别“Sc”。 |
static byte |
DASH_PUNCTUATION
Unicode 规范中的常规类别“Pd”。 |
static byte |
DECIMAL_DIGIT_NUMBER
Unicode 规范中的常规类别“Nd”。 |
static byte |
DIRECTIONALITY_ARABIC_NUMBER
Unicode 规范中的弱双向字符类型“AN”。 |
static byte |
DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode 规范中的弱双向字符类型“BN”。 |
static byte |
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode 规范中的弱双向字符类型“CS”。 |
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER
Unicode 规范中的弱双向字符类型“EN”。 |
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode 规范中的弱双向字符类型“ES”。 |
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode 规范中的弱双向字符类型“ET”。 |
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT
Unicode 规范中的强双向字符类型“L”。 |
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode 规范中的强双向字符类型“LRE”。 |
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode 规范中的强双向字符类型“LRO”。 |
static byte |
DIRECTIONALITY_NONSPACING_MARK
Unicode 规范中的弱双向字符类型“NSM”。 |
static byte |
DIRECTIONALITY_OTHER_NEUTRALS
Unicode 规范中的非特定双向字符类型“ON”。 |
static byte |
DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode 规范中的非特定双向字符类型“B”。 |
static byte |
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode 规范中的弱双向字符类型“PDF”。 |
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT
Unicode 规范中的强双向字符类型“R”。 |
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode 规范中的强双向字符类型“AL”。 |
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode 规范中的强双向字符类型“RLE”。 |
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode 规范中的强双向字符类型“RLO”。 |
static byte |
DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode 规范中的非特定双向字符类型“S”。 |
static byte |
DIRECTIONALITY_UNDEFINED
未定义的双向字符类型。 |
static byte |
DIRECTIONALITY_WHITESPACE
Unicode 规范中的非特定双向字符类型“WS”。 |
static byte |
ENCLOSING_MARK
Unicode 规范中的常规类别“Me”。 |
static byte |
END_PUNCTUATION
Unicode 规范中的常规类别“Pe”。 |
static byte |
FINAL_QUOTE_PUNCTUATION
Unicode 规范中的常规类别“Pf”。 |
static byte |
FORMAT
Unicode 规范中的常规类别“Cf”。 |
static byte |
INITIAL_QUOTE_PUNCTUATION
Unicode 规范中的常规类别“Pi”。 |
static byte |
LETTER_NUMBER
Unicode 规范中的常规类别“Nl”。 |
static byte |
LINE_SEPARATOR
Unicode 规范中的常规类别“Zl”。 |
static byte |
LOWERCASE_LETTER
Unicode 规范中的常规类别“Ll”。 |
static byte |
MATH_SYMBOL
Unicode 规范中的常规类别“Sm”。 |
static int |
MAX_CODE_POINT
Unicode 代码点的最大值。 |
static char |
MAX_HIGH_SURROGATE
UTF-16 编码中的 Unicode 高代理项代码单元的最大值。 |
static char |
MAX_LOW_SURROGATE
UTF-16 编码中的 Unicode 低代理项代码单元的最大值。 |
static int |
MAX_RADIX
可用于与字符串相互转换的最大基数。 |
static char |
MAX_SURROGATE
UTF-16 编码中的 Unicode 代理项代码单元的最大值。 |
static char |
MAX_VALUE
此字段的常量值是 char 类型的最大值,即 '\uFFFF'。 |
static int |
MIN_CODE_POINT
Unicode 代码点的最小值。 |
static char |
MIN_HIGH_SURROGATE
UTF-16 编码中的 Unicode 高代理项代码单元的最小值。 |
static char |
MIN_LOW_SURROGATE
UTF-16 编码中的 Unicode 低代理项代码单元的最小值。 |
static int |
MIN_RADIX
可用于与字符串相互转换的最小基数。 |
static int |
MIN_SUPPLEMENTARY_CODE_POINT
增补代码点的最小值。 |
static char |
MIN_SURROGATE
UTF-16 编码中的 Unicode 代理项代码单元的最小值。 |
static char |
MIN_VALUE
此字段的常量值是 char 类型的最小值,即 '\u0000'。 |
static byte |
MODIFIER_LETTER
Unicode 规范中的常规类别“Lm”。 |
static byte |
MODIFIER_SYMBOL
Unicode 规范中的常规类别“Sk”。 |
static byte |
NON_SPACING_MARK
Unicode 规范中的常规类别“Mn”。 |
static byte |
OTHER_LETTER
Unicode 规范中的常规类别“Lo”。 |
static byte |
OTHER_NUMBER
Unicode 规范中的常规类别“No”。 |
static byte |
OTHER_PUNCTUATION
Unicode 规范中的常规类别“Po”。 |
static byte |
OTHER_SYMBOL
Unicode 规范中的常规类别“So”。 |
static byte |
PARAGRAPH_SEPARATOR
Unicode 规范中的常规类别“Zp”。 |
static byte |
PRIVATE_USE
Unicode 规范中的常规类别“Co”。 |
static int |
SIZE
用来以无符号二进制形式表示 char 值的位数。 |
static byte |
SPACE_SEPARATOR
Unicode 规范中的常规类别“Zs”。 |
static byte |
START_PUNCTUATION
Unicode 规范中的常规类别“Ps”。 |
static byte |
SURROGATE
Unicode 规范中的常规类别“Cs”。 |
static byte |
TITLECASE_LETTER
Unicode 规范中的常规类别“Lt”。 |
static Class<Character> |
TYPE
表示基本类型 char 的 Class 实例。 |
static byte |
UNASSIGNED
Unicode 规范中的常规类别“Cn”。 |
static byte |
UPPERCASE_LETTER
Unicode 规范中的常规类别“Lu”。 |
| 构造方法摘要 | |
|---|---|
Character(char value)
构造一个新分配的 Character 对象,用以表示指定的 char 值。 |
|
| 方法摘要 | |
|---|---|
static int |
charCount(int codePoint)
确定表示指定字符(Unicode 代码点)所需的 char 值的数量。 |
char |
charValue()
返回此 Character 对象的值。 |
static int |
codePointAt(char[] a,
int index)
返回 char 数组的给定索引上的代码点。 |
static int |
codePointAt(char[] a,
int index,
int limit)
返回 char 数组的给定索引上的代码点,该数组中只有那些具有小于 limit 的 index 值的数组元素可以使用。 |
static int |
codePointAt(CharSequence seq,
int index)
返回 CharSequence 的给定索引上的代码点。 |
static int |
codePointBefore(char[] a,
int index)
返回 char 数组的给定索引前面的代码点。 |
static int |
codePointBefore(char[] a,
int index,
int start)
返回 char 数组的给定索引前面的代码点,该数组中只有那些具有大于等于 start 的 index 值的数组元素可以使用。 |
static int |
codePointBefore(CharSequence seq,
int index)
返回 CharSequence 的给定索引前面的代码点。 |
static int |
codePointCount(char[] a,
int offset,
int count)
返回 char 数组参数的子数组中 Unicode 代码点的数量。 |
static int |
codePointCount(CharSequence seq,
int beginIndex,
int endIndex)
返回指定字符序列的文本范围内的 Unicode 代码点数量。 |
int |
compareTo(Character anotherCharacter)
根据数字比较两个 Character 对象。 |
static int |
digit(char ch,
int radix)
返回使用指定基数的字符 ch 的数值。 |
static int |
digit(int codePoint,
int radix)
返回使用指定基数的指定字符(Unicode 代码点)的数值。 |
boolean |
equals(Object obj)
将此对象与指定对象比较。 |
static char |
forDigit(int digit,
int radix)
确定使用指定基数的特定数字的字符表示形式。 |
static byte |
getDirectionality(char ch)
返回给定字符的 Unicode 方向属性。 |
static byte |
getDirectionality(int codePoint)
返回给定字符(Unicode 代码点)的 Unicode 方向属性。 |
static int |
getNumericValue(char ch)
返回指定的 Unicode 字符表示的 int 值。 |
static int |
getNumericValue(int codePoint)
返回指定字符(Unicode 代码点)表示的 int 值。 |
static int |
getType(char ch)
返回一个指示字符的常规类别的值。 |
static int |
getType(int codePoint)
返回一个指示字符的常规类别的值。 |
int |
hashCode()
返回此 Character 的哈希码。 |
static boolean |
isDefined(char ch)
确定字符是否被定义为 Unicode 中的字符。 |
static boolean |
isDefined(int codePoint)
确定字符(Unicode 代码点)是否被定义为 Unicode 中的字符。 |
static boolean |
isDigit(char ch)
确定指定字符是否为数字。 |
static boolean |
isDigit(int codePoint)
确定指定字符(Unicode 代码点)是否为数字。 |
static boolean |
isHighSurrogate(char ch)
确定给出的 char 值是否为一个高代理项代码单元(也称为前导代理项代码单元)。 |
static boolean |
isIdentifierIgnorable(char ch)
确定是否应该认为指定字符是 Java 标识符或 Unicode 标识符中可忽略的一个字符。 |
static boolean |
isIdentifierIgnorable(int codePoint)
确定是否应该认为指定字符(Unicode 代码点)是 Java 标识符或 Unicode 标识符中可忽略的一个字符。 |
static boolean |
isISOControl(char ch)
确定指定字符是否为 ISO 控制字符。 |
static boolean |
isISOControl(int codePoint)
确定引用的字符(Unicode 代码点)是否为 ISO 控制字符。 |
static boolean |
isJavaIdentifierPart(char ch)
确定指定字符是否可以是 Java 标识符中首字符以外的部分。 |
static boolean |
isJavaIdentifierPart(int codePoint)
确定字符(Unicode 代码点)是否可以是 Java 标识符中首字符以外的部分。 |
static boolean |
isJavaIdentifierStart(char ch)
确定是否允许将指定字符作为 Java 标识符中的首字符。 |
static boolean |
isJavaIdentifierStart(int codePoint)
确定是否允许将字符(Unicode 代码点)作为 Java 标识符中的首字符。 |
static boolean |
isJavaLetter(char ch)
已过时。 由 isJavaIdentifierStart(char) 取代。 |
static boolean |
isJavaLetterOrDigit(char ch)
已过时。 由 isJavaIdentifierPart(char) 取代。 |
static boolean |
isLetter(char ch)
确定指定字符是否为字母。 |
static boolean |
isLetter(int codePoint)
确定指定字符(Unicode 代码点)是否为字母。 |
static boolean |
isLetterOrDigit(char ch)
确定指定字符是否为字母或数字。 |
static boolean |
isLetterOrDigit(int codePoint)
确定指定字符(Unicode 代码点)是否为字母或数字。 |
static boolean |
isLowerCase(char ch)
确定指定字符是否为小写字母。 |
static boolean |
isLowerCase(int codePoint)
确定指定字符(Unicode 代码点)是否为小写字母。 |
static boolean |
isLowSurrogate(char ch)
确定给定 char 值是否一个低代理项代码单元(也称为尾部代理项代码单元)。 |
static boolean |
isMirrored(char ch)
确定指定字符依据 Unicode 规范是否对称。 |
static boolean |
isMirrored(int codePoint)
确定指定字符(Unicode 代码点)依据 Unicode 规范是否对称。 |
static boolean |
isSpace(char ch)
已过时。 由 isWhitespace(char) 取代。 |
static boolean |
isSpaceChar(char ch)
确定指定字符是否为 Unicode 空白字符。 |
static boolean |
isSpaceChar(int codePoint)
确定指定字符(Unicode 代码点)是否为 Unicode 空白字符。 |
static boolean |
isSupplementaryCodePoint(int codePoint)
确定指定字符(Unicode 代码点)是否在增补字符范围内。 |
static boolean |
isSurrogatePair(char high,
char low)
确定指定的 char 值对是否为有效的代理项对。 |
static boolean |
isTitleCase(char ch)
确定指定字符是否为首字母大写字符。 |
static boolean |
isTitleCase(int codePoint)
确定指定字符(Unicode 代码点)是否为首字母大写字符。 |
static boolean |
isUnicodeIdentifierPart(char ch)
确定指定字符是否可以是 Unicode 标识符中首字符以外的部分。 |
static boolean |
isUnicodeIdentifierPart(int codePoint)
确定指定字符(Unicode 代码点)是否可以是 Unicode 标识符中首字符以外的部分。 |
static boolean |
isUnicodeIdentifierStart(char ch)
确定是否允许将指定字符作为 Unicode 标识符中的首字符。 |
static boolean |
isUnicodeIdentifierStart(int codePoint)
确定是否允许将指定字符(Unicode 代码点)作为 Unicode 标识符中的首字符。 |
static boolean |
isUpperCase(char ch)
确定指定字符是否为大写字母。 |
static boolean |
isUpperCase(int codePoint)
确定指定字符(Unicode 代码点)是否为大写字母。 |
static boolean |
isValidCodePoint(int codePoint)
确定指定的代码点是否为从 0x0000 到 0x10FFFF 范围之内的有效 Unicode 代码点值。 |
static boolean |
isWhitespace(char ch)
确定指定字符依据 Java 标准是否为空白字符。 |
static boolean |
isWhitespace(int codePoint)
确定指定字符(Unicode 代码点)依据 Java 标准是否为空白字符。 |
static int |
offsetByCodePoints(char[] a,
int start,
int count,
int index,
int codePointOffset)
返回给定 char 子数组中的索引,它是从给定 index 到 codePointOffset 代码点的偏移量。 |
static int |
offsetByCodePoints(CharSequence seq,
int index,
int codePointOffset)
返回给定字符序列中的索引,它是从给定 index 到 codePointOffset 代码点的偏移量。 |
static char |
reverseBytes(char ch)
返回通过反转指定 char 值中的字节顺序而获得的值。 |
static char[] |
toChars(int codePoint)
将指定的字符(Unicode 代码点)转换成其存储在 char 数组中的 UTF-16 表示形式。 |
static int |
toChars(int codePoint,
char[] dst,
int dstIndex)
将指定字符(Unicode 代码点)转换为其 UTF-16 表示形式。 |
static int |
toCodePoint(char high,
char low)
将指定的代理项对转换为其增补代码点值。 |
static char |
toLowerCase(char ch)
使用取自 UnicodeData 文件的大小写映射信息将字符参数转换为小写。 |
static int |
toLowerCase(int codePoint)
使用取自 UnicodeData 文件的大小写映射信息将字符(Unicode 代码点)参数转换为小写。 |
String |
toString()
返回表示此 Character 值的 String 对象。 |
static String |
toString(char c)
返回一个表示指定 char 值的 String 对象。 |
static char |
toTitleCase(char ch)
使用取自 UnicodeData 文件的大小写映射信息将字符参数转换为首字母大写。 |
static int |
toTitleCase(int codePoint)
使用取自 UnicodeData 文件的大小写映射信息将字符(Unicode 代码点)参数转换为首字母大写。 |
static char |
toUpperCase(char ch)
使用取自 UnicodeData 文件的大小写映射信息将字符参数转换为大写。 |
static int |
toUpperCase(int codePoint)
使用取自 UnicodeData 文件的大小写映射信息将字符(Unicode 代码点)参数转换为大写。 |
static Character |
valueOf(char c)
返回一个表示指定 char 值的 Character 实例。 |
| 从类 java.lang.Object 继承的方法 |
|---|
clone, finalize, getClass, notify, notifyAll, wait, wait, wait |
| 字段详细信息 |
|---|
public static final int MIN_RADIX
Integer 类的 digit、forDigit 和 toString 方法)中所允许的基数参数的最小值。
public static final int MAX_RADIX
Integer 类的 digit、forDigit 和 toString 方法)中所允许的基数参数的最大值。
public static final char MIN_VALUE
char 类型的最小值,即 '\u0000'。
public static final char MAX_VALUE
char 类型的最大值,即 '\uFFFF'。
public static final Class<Character> TYPE
char 的 Class 实例。
public static final byte UNASSIGNED
public static final byte UPPERCASE_LETTER
public static final byte LOWERCASE_LETTER
public static final byte TITLECASE_LETTER
public static final byte MODIFIER_LETTER
public static final byte OTHER_LETTER
public static final byte NON_SPACING_MARK
public static final byte ENCLOSING_MARK
public static final byte COMBINING_SPACING_MARK
public static final byte DECIMAL_DIGIT_NUMBER
public static final byte LETTER_NUMBER
public static final byte OTHER_NUMBER
public static final byte SPACE_SEPARATOR
public static final byte LINE_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
public static final byte CONTROL
public static final byte FORMAT
public static final byte PRIVATE_USE
public static final byte SURROGATE
public static final byte DASH_PUNCTUATION
public static final byte START_PUNCTUATION
public static final byte END_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
public static final byte OTHER_PUNCTUATION
public static final byte MATH_SYMBOL
public static final byte CURRENCY_SYMBOL
public static final byte MODIFIER_SYMBOL
public static final byte OTHER_SYMBOL
public static final byte INITIAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
public static final byte DIRECTIONALITY_UNDEFINED
char 值在 Unicode 规范中具有未定义的方向性。
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final char MIN_HIGH_SURROGATE
public static final char MAX_HIGH_SURROGATE
public static final char MIN_LOW_SURROGATE
public static final char MAX_LOW_SURROGATE
public static final char MIN_SURROGATE
public static final char MAX_SURROGATE
public static final int MIN_SUPPLEMENTARY_CODE_POINT
public static final int MIN_CODE_POINT
public static final int MAX_CODE_POINT
public static final int SIZE
| 构造方法详细信息 |
|---|
public Character(char value)
Character 对象,用以表示指定的 char 值。
value - Character 对象表示的值。| 方法详细信息 |
|---|
public static Character valueOf(char c)
Character(char),因为该方法很可能通过缓存经常请求的值来显著提高空间和时间性能。
c - 一个 char 值。
public char charValue()
Character 对象的值。
char 值。public int hashCode()
Character 的哈希码。
Object.equals(java.lang.Object),
Hashtablepublic boolean equals(Object obj)
null,而是一个与此对象包含相同 char 值的 Character 对象时,结果才是 true。
obj - 比较的对象。
true;否则返回 false。Object.hashCode(),
Hashtablepublic String toString()
Character 值的 String 对象。结果是一个长度为 1 的字符串,其唯一组件是此 Character 对象表示的基本 char 值。
public static String toString(char c)
char 值的 String 对象。结果是长度为 1 的字符串,仅由指定的 char 组成。
c - 要转换的 char 值
char 值的字符串表示形式public static boolean isValidCodePoint(int codePoint)
0x0000 到 0x10FFFF 范围之内的有效 Unicode 代码点值。该方法等效于以下表达式:
codePoint >= 0x0000 && codePoint <= 0x10FFFF
codePoint - 要测试的 Unicode 代码点
true;否则返回 false。public static boolean isSupplementaryCodePoint(int codePoint)
codePoint >= 0x10000 && codePoint <= 0x10FFFF
codePoint - 要测试的字符(Unicode 代码点)
true;否则返回 false。public static boolean isHighSurrogate(char ch)
char 值是否为一个高代理项代码单元(也称为前导代理项代码单元)。这类值并不表示它们本身的字符,而被用来表示 UTF-16 编码中的增补字符。
该方法返回 true 的条件是当且仅当
为ch >= '\uD800' && ch <= '\uDBFF'
true。
ch - 要测试的 char 值。
char 值在 '\uD800' 与 '\uDBFF' 所包含的范围之间,则返回 true;否则返回 false。isLowSurrogate(char),
Character.UnicodeBlock.of(int)public static boolean isLowSurrogate(char ch)
char 值是否一个低代理项代码单元(也称为尾部代理项代码单元)。这类值并不表示它们本身的字符,而被用来表示 UTF-16 编码中的增补字符。
该方法返回 true 的条件是当且仅当
为ch >= '\uDC00' && ch <= '\uDFFF'
true。
ch - 要测试的 char 值。
char 值在 '\uDC00' 与 '\uDFFF' 所包含的范围之间,则返回 true;否则返回 false。isHighSurrogate(char)
public static boolean isSurrogatePair(char high,
char low)
char 值对是否为有效的代理项对。该方法等效于以下表达式:
isHighSurrogate(high) && isLowSurrogate(low)
high - 要测试的高代理项代码值low - 要测试的低代理项代码值
true;否则返回 false。public static int charCount(int codePoint)
char 值的数量。如果指定字符等于或大于 0x10000,则该方法返回的值为 2。否则,该方法返回的值为 1。
该方法没有验证指定的字符是否为一个有效的 Unicode 代码点。如有必要,调用者必须使用 isValidCodePoint 验证字符值。
codePoint - 要测试的字符(Unicode 代码点)。
isSupplementaryCodePoint(int)
public static int toCodePoint(char high,
char low)
isSurrogatePair 验证它。
high - 高代理项代码单元low - 低代理项代码单元
public static int codePointAt(CharSequence seq, int index)
CharSequence 的给定索引上的代码点。如果 CharSequence 中的给定索引上的 char 值在高代理项范围内,则下列索引的长度小于 CharSequence 的长度,如果下列索引上的 char 值在低代理项范围内,则返回对应于此代理项对的增补代码点。否则,返回给定索引上的 char 值。
seq - char 值(Unicode 代码单元)的序列index - 要转换的 seq 中的 char 值(Unicode 代码单元)的索引
NullPointerException - 如果 seq 为 null。
IndexOutOfBoundsException - 如果 index 值为负或不小于 seq.length()。
public static int codePointAt(char[] a,
int index)
char 数组的给定索引上的代码点。如果 char 数组中的给定索引上的 char 值在高代理项范围内,则下一个索引的长度小于 char 数组的长度,如果下一个索引上的 char 值在低代理项范围内,则返回对应于此代理项对的增补代码点。否则,返回给定索引上的 char 值。
a - char 数组index - 要转换的 char 数组中的 char 值(Unicode 代码单元)的索引
NullPointerException - 如果 a 为 null。
IndexOutOfBoundsException - 如果 index 值为负或不小于 char 数组的长度。
public static int codePointAt(char[] a,
int index,
int limit)
char 数组的给定索引上的代码点,该数组中只有那些具有小于 limit 的 index 值的数组元素可以使用。如果 char 数组中的给定索引上的 char 值在高代理项范围内,则下一个索引小于 limit,如果下一个索引上的 char 值在低代理项范围内,则返回对应于此代理项对的增补代码点。否则,返回给定索引上的 char 值。
a - char 数组index - 要转换的 char 数组中的 char 值(Unicode 代码点)的索引limit - 可以在 char 数组中使用的最后一个数组元素后面的索引
NullPointerException - 如果 a 为 null。
IndexOutOfBoundsException - 如果 index 参数为负或不小于 limit 参数,或者 limit 参数为负或大于 char 数组的长度。public static int codePointBefore(CharSequence seq, int index)
CharSequence 的给定索引前面的代码点。如果 CharSequence 中的 (index - 1) 上的 char 值在低代理项范围内,则 (index - 2) 为非负,如果 CharSequence 中的 (index - 2) 上的 char 值在高代理项范围内,则返回对应于此代理项对的增补代码点。否则,返回 (index - 1) 上的 char 值。
seq - CharSequence 实例index - 应该返回的代码点后面的索引
NullPointerException - 如果 seq 为 null。
IndexOutOfBoundsException - 如果 index 参数小于 1 或者大于 seq.length()。
public static int codePointBefore(char[] a,
int index)
char 数组的给定索引前面的代码点。如果 char 数组中的 (index - 1) 上的 char 值在低代理项范围内,则 (index - 2) 为非负,如果 char 数组中的 (index - 2) 上的 char 值在高代理项范围内,则返回对应于此代理项对的增补代码点。否则,返回 (index - 1) 上的 char 值。
a - char 数组index - 应该返回的代码点后面的索引
NullPointerException - 如果 a 为 null。
IndexOutOfBoundsException - 如果 index 参数小于 1 或大于 char 数组的长度
public static int codePointBefore(char[] a,
int index,
int start)
char 数组的给定索引前面的代码点,该数组中只有那些具有大于等于 start 的 index 值的数组元素可以使用。如果 char 数组中的 (index - 1) 上的 char 值在低代理项范围内,则 (index - 2) 不小于 start,如果 char 数组中的 (index - 2) 上的 char 值在高代理项范围内,则返回对应于此代理项对的增补代码点。否则,返回 (index - 1) 上的 char 值。
a - char 数组index - 应该返回的代码点后面的索引start - char 数组中第一个数组元素的索引
NullPointerException - 如果 a 为 null。
IndexOutOfBoundsException - 如果 index 参数不大于 start 参数或大于 char 数组的长度,或者 start 参数为负或小于 char 数组的长度。
public static int toChars(int codePoint,
char[] dst,
int dstIndex)
dst[dstIndex] 中存储相同的值,并返回 1。如果指定代码点是一个增补字符,则将其代理项值存储在 dst[dstIndex](高代理项)和 dst[dstIndex+1](低代理项)中,并返回 2。
codePoint - 要转换的字符(Unicode 代码点)。dst - char 的一个数组,codePoint 的 UTF-16 值存储在其中。dstIndex - 进入存储已转换值的 dst 数组中的起始索引。
IllegalArgumentException - 如果指定的 codePoint 不是一个有效的 Unicode 代码点。
NullPointerException - 如果指定的 dst 为 null。
IndexOutOfBoundsException - 如果 dstIndex 为负或不小于 dst.length,或者 dstIndex 上的 dst 没有足够多的数组元素来存储得到的 char 值。(如果 dstIndex 等于 dst.length-1 并且指定的 codePoint 是一个增补字符,则不在 dst[dstIndex] 中存储高代理项值。)public static char[] toChars(int codePoint)
char 数组中的 UTF-16 表示形式。如果指定的代码点是一个 BMP(Basic Multilingual Plane 或 Plane 0)值,则得到的 char 数组具有与 codePoint 相同的值。如果指定的代码点是一个增补代码点,则得到的 char 数组具有相应的代理项对。
codePoint - 一个 Unicode 代码点
codePoint 的 UTF-16 表示形式的 char 数组。
IllegalArgumentException - 如果指定的 codePoint 不是一个有效的 Unicode 代码点。public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
beginIndex,并扩展到索引 endIndex - 1 上的 char。因此文本范围的长度(char 形式)为 endIndex-beginIndex。文本范围内的不成对代理项是按一个代码点算作一个项进行计数的。
seq - 字符序列beginIndex - 文本范围的第一个 char 的索引。endIndex - 文本范围的最后一个 char 后面的索引。
NullPointerException - 如果 seq 为 null。
IndexOutOfBoundsException - 如果 beginIndex 为负,或者 endIndex 大于给定序列的长度,或者 beginIndex 大于 endIndex。
public static int codePointCount(char[] a,
int offset,
int count)
char 数组参数的子数组中 Unicode 代码点的数量。offset 参数是子数组的第一个 char 的索引,count 参数指定了 char 中的子数组的长度。子数组中不成对的代理项是按一个代码点算作一个项进行计数的。
a - char 数组offset - 给定 char 数组中第一个 char 的索引count - char 中的子数组的长度
NullPointerException - 如果 a 为 null。
IndexOutOfBoundsException - 如果 offset 或 count 为负,或者 offset + count 大于给定数组的长度。public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
index 到 codePointOffset 代码点的偏移量。index 和 codePointOffset 给出的文本范围内的不成对代理项是按一个代码点算作一个项进行计数的。
seq - 字符序列index - 要偏移的索引codePointOffset - 代码点中的偏移量
NullPointerException - 如果 seq 为 null。
IndexOutOfBoundsException - 如果 index 为负或大于字符序列的长度,或者 codePointOffset 为负并且起始于 index 的子序列拥有的偏移量少于 codePointOffset 代码点,或者 codePointOffset 为负并且 index 前面的子序列的偏移量少于 codePointOffset 代码点的绝对值。
public static int offsetByCodePoints(char[] a,
int start,
int count,
int index,
int codePointOffset)
char 子数组中的索引,它是从给定 index 到 codePointOffset 代码点的偏移量。start 和 count 参数指定了 char 数组的一个子数组。index 和 codePointOffset 给出的文本范围内的不成对代理项是按一个代码点算作一个项进行计数的。
a - char 数组start - 子数组的第一个 char 的索引count - char 中的子数组的长度index - 要偏移的索引codePointOffset - 代码点中的偏移量
NullPointerException - 如果 a 为 null。
IndexOutOfBoundsException - 如果存在以下情况:start 或 count 为负;start + count 大于给定数组的长度;index 小于 start 或大于 start + count;codePointOffset 为负并且起始于 index、终止于 start + count - 1 的文本字段的偏移量少于 codePointOffset 代码点;codePointOffset 为负并且起始于 start、终止于 index - 1 的文本字段的偏移量少于 codePointOffset 代码点的绝对值。public static boolean isLowerCase(char ch)
如果通过 Character.getType(ch) 提供的字符的常规类别类型为 LOWERCASE_LETTER,则字符为小写字母。
以下是小写字母的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
其他许多 Unicode 字符也是小写的。
注:此方法无法处理增补字符。若要支持所有 Unicode 字符,包括增补字符,请使用 isLowerCase(int) 方法。
ch - 要测试的字符。
true;否则返回 false。isLowerCase(char),
isTitleCase(char),
toLowerCase(char),
getType(char)public static boolean isLowerCase(int codePoint)
如果通过 getType(codePoint) 提供的字符的常规类别的类型为 LOWERCASE_LETTER,则字符为小写字母。
以下是小写字母的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
其他许多 Unicode 字符也是小写的。
codePoint - 要测试的字符(Unicode 代码点)。
true;否则返回 false。isLowerCase(int),
isTitleCase(int),
toLowerCase(int),
getType(int)public static boolean isUpperCase(char ch)
如果通过 Character.getType(ch) 提供的字符的常规类别类型为 UPPERCASE_LETTER,则字符为大写字母。
以下是大写字母的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
其他许多 Unicode 字符也是大写的。
注:此方法无法处理增补字符。若要支持所有 Unicode 字符,包括增补字符,请使用 isUpperCase(int) 方法。
ch - 要测试的字符。