public final class UScript
extends Object
java.lang.Object | |
↳ | android.icu.lang.UScript |
ISO 15924脚本代码的常量和相关函数。
当前的一组脚本代码常量至少支持所有以ICU当前支持的Unicode版本编码的脚本。 常量的名称通常来自Unicode脚本属性值别名。 请参阅UAX#24 Unicode脚本属性(http://www.unicode.org/reports/tr24/)和http://www.unicode.org/Public/UCD/latest/ucd/PropertyValueAliases.txt。
从ICU 3.6开始,包含大多数ISO 15924脚本代码的常量,用于语言标记,CLDR数据和类似语言。 Unicode字符数据库(UCD)中没有使用这些代码中的一部分代码。 例如,没有字符具有Hans或Hant的UCD脚本属性值。 所有的汉字表意文字都是Unicode编码的Hani脚本属性值。
不包括专用代码Qaaa..Qabx。
从ICU 55开始,脚本代码仅在其脚本已经或将会以Unicode编码时被添加,并且已经被分配了Unicode脚本属性值别名,以确保它们的脚本名称是稳定的并且匹配常量的名称。 可以在任何时候添加不受单独编码影响的脚本代码,如Latf和Aran。
Nested classes |
|
---|---|
枚举 |
UScript.ScriptUsage 脚本使用常量。 |
Constants |
|
---|---|
int |
AFAKA ISO 15924脚本代码 |
int |
AHOM ISO 15924脚本代码 |
int |
ANATOLIAN_HIEROGLYPHS ISO 15924脚本代码 |
int |
ARABIC 阿拉伯 |
int |
ARMENIAN 亚美尼亚 |
int |
AVESTAN ISO 15924脚本代码 |
int |
BALINESE ISO 15924脚本代码 |
int |
BAMUM ISO 15924脚本代码 |
int |
BASSA_VAH ISO 15924脚本代码 |
int |
BATAK ISO 15924脚本代码 |
int |
BENGALI 孟加拉 |
int |
BLISSYMBOLS ISO 15924脚本代码 |
int |
BOOK_PAHLAVI ISO 15924脚本代码 |
int |
BOPOMOFO 汉语拼音 |
int |
BRAHMI ISO 15924脚本代码 |
int |
BRAILLE Unicode 4中的盲文脚本 |
int |
BUGINESE 脚本在Unicode 4.1中 |
int |
BUHID 布迪文 |
int |
CANADIAN_ABORIGINAL 统一的加拿大土着标志 |
int |
CARIAN ISO 15924脚本代码 |
int |
CAUCASIAN_ALBANIAN ISO 15924脚本代码 |
int |
CHAKMA ISO 15924脚本代码 |
int |
CHAM ISO 15924脚本代码 |
int |
CHEROKEE 切诺基 |
int |
CIRTH ISO 15924脚本代码 |
int |
COMMON 共同 |
int |
COPTIC 科普特 |
int |
CUNEIFORM ISO 15924脚本代码 |
int |
CYPRIOT Unicode 4中的塞浦路斯脚本 |
int |
CYRILLIC 西里尔 |
int |
DEMOTIC_EGYPTIAN ISO 15924脚本代码 |
int |
DESERET 犹他州 |
int |
DEVANAGARI 梵文 |
int |
DUPLOYAN ISO 15924脚本代码 |
int |
EASTERN_SYRIAC ISO 15924脚本代码 |
int |
EGYPTIAN_HIEROGLYPHS ISO 15924脚本代码 |
int |
ELBASAN ISO 15924脚本代码 |
int |
ESTRANGELO_SYRIAC ISO 15924脚本代码 |
int |
ETHIOPIC 衣索比亚 |
int |
GEORGIAN 格鲁吉亚 |
int |
GLAGOLITIC 脚本在Unicode 4.1中 |
int |
GOTHIC 哥特 |
int |
GRANTHA ISO 15924脚本代码 |
int |
GREEK 希腊语 |
int |
GUJARATI 古吉拉特语 |
int |
GURMUKHI 古尔穆基 |
int |
HAN 韩 |
int |
HANGUL 韩文 |
int |
HANUNOO Hanunooo |
int |
HARAPPAN_INDUS ISO 15924脚本代码 |
int |
HATRAN ISO 15924脚本代码 |
int |
HEBREW 希伯来语 |
int |
HIERATIC_EGYPTIAN ISO 15924脚本代码 |
int |
HIRAGANA 平假名 |
int |
IMPERIAL_ARAMAIC ISO 15924脚本代码 |
int |
INHERITED 遗传 |
int |
INSCRIPTIONAL_PAHLAVI ISO 15924脚本代码 |
int |
INSCRIPTIONAL_PARTHIAN ISO 15924脚本代码 |
int |
INVALID_CODE 无效的代码 |
int |
JAPANESE ISO 15924脚本代码 |
int |
JAVANESE ISO 15924脚本代码 |
int |
JURCHEN ISO 15924脚本代码 |
int |
KAITHI ISO 15924脚本代码 |
int |
KANNADA 卡纳达语 |
int |
KATAKANA 片假名 |
int |
KATAKANA_OR_HIRAGANA 脚本使用Unicode 4.0.1 |
int |
KAYAH_LI ISO 15924脚本代码 |
int |
KHAROSHTHI 脚本在Unicode 4.1中 |
int |
KHMER 高棉 |
int |
KHOJKI ISO 15924脚本代码 |
int |
KHUDAWADI ISO 15924脚本代码 |
int |
KHUTSURI ISO 15924脚本代码 |
int |
KOREAN ISO 15924脚本代码 |
int |
KPELLE ISO 15924脚本代码 |
int |
LANNA ISO 15924脚本代码 |
int |
LAO 老挝 |
int |
LATIN 拉丁 |
int |
LATIN_FRAKTUR ISO 15924脚本代码 |
int |
LATIN_GAELIC ISO 15924脚本代码 |
int |
LEPCHA ISO 15924脚本代码 |
int |
LIMBU 在Unicode 4中的Limbu脚本 |
int |
LINEAR_A ISO 15924脚本代码 |
int |
LINEAR_B Unicode 4中的线性B脚本 |
int |
LISU ISO 15924脚本代码 |
int |
LOMA ISO 15924脚本代码 |
int |
LYCIAN ISO 15924脚本代码 |
int |
LYDIAN ISO 15924脚本代码 |
int |
MAHAJANI ISO 15924脚本代码 |
int |
MALAYALAM 马拉雅拉姆语 |
int |
MANDAEAN ISO 15924脚本代码 |
int |
MANDAIC ISO 15924脚本代码 |
int |
MANICHAEAN ISO 15924脚本代码 |
int |
MATHEMATICAL_NOTATION ISO 15924脚本代码 |
int |
MAYAN_HIEROGLYPHS ISO 15924脚本代码 |
int |
MEITEI_MAYEK ISO 15924脚本代码 |
int |
MENDE Mende Kikakui ISO 15924脚本代码 |
int |
MEROITIC ISO 15924脚本代码 |
int |
MEROITIC_CURSIVE ISO 15924脚本代码 |
int |
MEROITIC_HIEROGLYPHS ISO 15924脚本代码 |
int |
MIAO ISO 15924脚本代码 |
int |
MODI ISO 15924脚本代码 |
int |
MONGOLIAN Mangolian |
int |
MOON ISO 15924脚本代码 |
int |
MRO ISO 15924脚本代码 |
int |
MULTANI ISO 15924脚本代码 |
int |
MYANMAR Myammar |
int |
NABATAEAN ISO 15924脚本代码 |
int |
NAKHI_GEBA ISO 15924脚本代码 |
int |
NEW_TAI_LUE 脚本在Unicode 4.1中 |
int |
NKO ISO 15924脚本代码 |
int |
NUSHU ISO 15924脚本代码 |
int |
OGHAM 欧甘文 |
int |
OLD_CHURCH_SLAVONIC_CYRILLIC ISO 15924脚本代码 |
int |
OLD_HUNGARIAN ISO 15924脚本代码 |
int |
OLD_ITALIC 老意大利 |
int |
OLD_NORTH_ARABIAN ISO 15924脚本代码 |
int |
OLD_PERMIC ISO 15924脚本代码 |
int |
OLD_PERSIAN 脚本在Unicode 4.1中 |
int |
OLD_SOUTH_ARABIAN ISO 15924脚本代码 |
int |
OL_CHIKI ISO 15924脚本代码 |
int |
ORIYA 奥里亚语 |
int |
ORKHON ISO 15924脚本代码 |
int |
OSMANYA Osmanya脚本在Unicode 4 |
int |
PAHAWH_HMONG ISO 15924脚本代码 |
int |
PALMYRENE ISO 15924脚本代码 |
int |
PAU_CIN_HAU ISO 15924脚本代码 |
int |
PHAGS_PA ISO 15924脚本代码 |
int |
PHOENICIAN ISO 15924脚本代码 |
int |
PHONETIC_POLLARD ISO 15924脚本代码 |
int |
PSALTER_PAHLAVI ISO 15924脚本代码 |
int |
REJANG ISO 15924脚本代码 |
int |
RONGORONGO ISO 15924脚本代码 |
int |
RUNIC 符文 |
int |
SAMARITAN ISO 15924脚本代码 |
int |
SARATI ISO 15924脚本代码 |
int |
SAURASHTRA ISO 15924脚本代码 |
int |
SHARADA ISO 15924脚本代码 |
int |
SHAVIAN Unicode中的Shavian脚本4 |
int |
SIDDHAM ISO 15924脚本代码 |
int |
SIGN_WRITING Sutton SignWriting的ISO 15924脚本代码 |
int |
SIMPLIFIED_HAN ISO 15924脚本代码 |
int |
SINDHI ISO 15924脚本代码 |
int |
SINHALA 僧伽罗语 |
int |
SORA_SOMPENG ISO 15924脚本代码 |
int |
SUNDANESE ISO 15924脚本代码 |
int |
SYLOTI_NAGRI 脚本在Unicode 4.1中 |
int |
SYMBOLS ISO 15924脚本代码 |
int |
SYRIAC 叙利亚 |
int |
TAGALOG 他加禄语 |
int |
TAGBANWA 塔格巴努亚文 |
int |
TAI_LE 泰勒脚本在Unicode 4 |
int |
TAI_VIET ISO 15924脚本代码 |
int |
TAKRI ISO 15924脚本代码 |
int |
TAMIL 泰米尔人 |
int |
TANGUT ISO 15924脚本代码 |
int |
TELUGU 泰卢固语 |
int |
TENGWAR ISO 15924脚本代码 |
int |
THAANA 坦纳 |
int |
THAI 泰国 |
int |
TIBETAN 藏 |
int |
TIFINAGH 脚本在Unicode 4.1中 |
int |
TIRHUTA ISO 15924脚本代码 |
int |
TRADITIONAL_HAN ISO 15924脚本代码 |
int |
UCAS 统一的加拿大原住民符号(别名) |
int |
UGARITIC Unicode 4中的Ugaritic脚本 |
int |
UNKNOWN ISO 15924脚本代码 |
int |
UNWRITTEN_LANGUAGES ISO 15924脚本代码 |
int |
VAI ISO 15924脚本代码 |
int |
VISIBLE_SPEECH ISO 15924脚本代码 |
int |
WARANG_CITI ISO 15924脚本代码 |
int |
WESTERN_SYRIAC ISO 15924脚本代码 |
int |
WOLEAI ISO 15924脚本代码 |
int |
YI 彝族音节 |
Public methods |
|
---|---|
static final boolean |
breaksBetweenLetters(int script) 如果脚本允许在字母之间换行(不包括连字符),则返回true。 |
static final int[] |
getCode(ULocale locale) 获取与给定语言环境或ISO 15924缩写或名称关联的脚本代码。 |
static final int[] |
getCode(String nameOrAbbrOrLocale) 获取与给定语言环境或ISO 15924缩写或名称关联的脚本代码。 |
static final int[] |
getCode(Locale locale) 获取与给定语言环境或ISO 15924缩写或名称关联的脚本代码。 |
static final int |
getCodeFromName(String nameOrAbbr) 返回与给定的Unicode脚本属性别名(名称或缩写)关联的脚本代码。 |
static final String |
getName(int scriptCode) 返回长的Unicode脚本名称,如果有的话。 |
static final String |
getSampleString(int script) 返回脚本示例字符串。 |
static final int |
getScript(int codepoint) 获取与给定码点关联的脚本代码。 |
static final int |
getScriptExtensions(int c, BitSet set) 将代码点c的Script_Extensions设置为脚本代码整数到输出BitSet中。 |
static final String |
getShortName(int scriptCode) 返回4个字母的ISO 15924脚本代码,如果Unicode具有该脚本的名称,则该代码与简短的Unicode脚本名称相同。 |
static final UScript.ScriptUsage |
getUsage(int script) 根据UAX#31 Unicode标识符和模式语法返回脚本使用情况。 |
static final boolean |
hasScript(int c, int sc) 代码点c的Script_Extensions是否包含脚本sc? 如果c没有显式的Script_Extensions,则测试c是否具有Script属性值sc。 |
static final boolean |
isCased(int script) 如果在脚本案例的现代(或最近)使用情况下习惯使用区分,则返回true。 |
static final boolean |
isRightToLeft(int script) 如果脚本从右向左书写,则返回true。 |
Inherited methods |
|
---|---|
From class java.lang.Object
|
int ANATOLIAN_HIEROGLYPHS
ISO 15924脚本代码
常量值:156(0x0000009c)
int EGYPTIAN_HIEROGLYPHS
ISO 15924脚本代码
常量值:71(0x00000047)
int INSCRIPTIONAL_PAHLAVI
ISO 15924脚本代码
常量值:122(0x0000007a)
int INSCRIPTIONAL_PARTHIAN
ISO 15924脚本代码
常量值:125(0x0000007d)
int KATAKANA_OR_HIRAGANA
脚本使用Unicode 4.0.1
常数值:54(0x00000036)
int MATHEMATICAL_NOTATION
ISO 15924脚本代码
常量值:128(0x00000080)
int MEROITIC_HIEROGLYPHS
ISO 15924脚本代码
常量值:86(0x00000056)
int OLD_CHURCH_SLAVONIC_CYRILLIC
ISO 15924脚本代码
常量值:68(0x00000044)
int SIGN_WRITING
Sutton SignWriting的ISO 15924脚本代码
常量值:112(0x00000070)
boolean breaksBetweenLetters (int script)
如果脚本允许在字母之间换行(不包括连字符),则返回true。 这样的脚本通常需要基于字典的分行。 例如,哈尼和泰国。
Parameters | |
---|---|
script |
int : script code |
Returns | |
---|---|
boolean |
true if the script allows line breaks between letters |
int[] getCode (ULocale locale)
获取与给定语言环境或ISO 15924缩写或名称关联的脚本代码。 返回给予“Malayam”或“Mlym”的MALAYAM。 返回给定“en”或“en_US”的LATIN
Parameters | |
---|---|
locale |
ULocale : ULocale |
Returns | |
---|---|
int[] |
The script codes array. null if the the code cannot be found. |
int[] getCode (String nameOrAbbrOrLocale)
获取与给定语言环境或ISO 15924缩写或名称关联的脚本代码。 返回给予“Malayam”或“Mlym”的MALAYAM。 返回给定“en”或“en_US”的LATIN
注意:要仅通过短或长脚本别名进行搜索, getCodeFromName(String)
改为使用getCodeFromName(String)
。 这样可以快速查找并且不会访问语言环境数据。
Parameters | |
---|---|
nameOrAbbrOrLocale |
String : name of the script or ISO 15924 code or locale |
Returns | |
---|---|
int[] |
The script codes array. null if the the code cannot be found. |
int[] getCode (Locale locale)
获取与给定语言环境或ISO 15924缩写或名称关联的脚本代码。 返回给予“Malayam”或“Mlym”的MALAYAM。 返回给定“en”或“en_US”的LATIN
Parameters | |
---|---|
locale |
Locale : Locale |
Returns | |
---|---|
int[] |
The script codes array. null if the the code cannot be found. |
int getCodeFromName (String nameOrAbbr)
返回与给定的Unicode脚本属性别名(名称或缩写)关联的脚本代码。 简短别名是ISO 15924脚本代码。 返回给予“Malayam”或“Mlym”的MALAYAM。
Parameters | |
---|---|
nameOrAbbr |
String : name of the script or ISO 15924 code |
Returns | |
---|---|
int |
The script code value, or INVALID_CODE if the code cannot be found. |
String getName (int scriptCode)
返回长的Unicode脚本名称,如果有的话。 否则返回4个字母的ISO 15924脚本代码。 返回给马拉雅姆的“Malayam”。
Parameters | |
---|---|
scriptCode |
int : int script code |
Returns | |
---|---|
String |
long script name as given in PropertyValueAliases.txt, or the 4-letter code |
Throws | |
---|---|
IllegalArgumentException |
if the script code is not valid |
String getSampleString (int script)
返回脚本示例字符串。 该字符串通常由一个代码点组成,但可能会更长。 如果脚本未编码,则字符串为空。
Parameters | |
---|---|
script |
int : script code |
Returns | |
---|---|
String |
the sample character string |
int getScript (int codepoint)
获取与给定码点关联的脚本代码。 返回给出0x0D02的UScript.MALAYAM
Parameters | |
---|---|
codepoint |
int : UChar32 codepoint |
Returns | |
---|---|
int |
The script code |
int getScriptExtensions (int c, BitSet set)
将代码点c的Script_Extensions设置为脚本代码整数到输出BitSet中。
UNKNOWN
code is put into the set and also returned. 有些字符通常用于多个脚本。 有关更多信息,请参阅UAX#24:http://www.unicode.org/reports/tr24/。
Script_Extensions属性是临时的。 它可能会在未来版本的Unicode标准中进行修改或删除,从而在ICU中进行修改或删除。
Parameters | |
---|---|
c |
int : code point |
set |
BitSet : set of script code integers; will be cleared, then bits are set corresponding to c's Script_Extensions |
Returns | |
---|---|
int |
negative number of script codes in c's Script_Extensions, or the non-negative single Script value |
String getShortName (int scriptCode)
返回4个字母的ISO 15924脚本代码,如果Unicode具有该脚本的名称,则该代码与简短的Unicode脚本名称相同。 返回给MALAYALAM的“Mlym”。
Parameters | |
---|---|
scriptCode |
int : int script code |
Returns | |
---|---|
String |
short script name (4-letter code) |
Throws | |
---|---|
IllegalArgumentException |
if the script code is not valid |
UScript.ScriptUsage getUsage (int script)
根据UAX#31 Unicode标识符和模式语法返回脚本使用情况。 如果脚本未以Unicode编码,则返回NOT_ENCODED
。
Parameters | |
---|---|
script |
int : script code |
Returns | |
---|---|
UScript.ScriptUsage |
script usage |
也可以看看:
boolean hasScript (int c, int sc)
代码点c的Script_Extensions是否包含脚本sc? 如果c没有显式的Script_Extensions,则测试c是否具有Script属性值sc。
有些字符通常用于多个脚本。 有关更多信息,请参阅UAX#24:http://www.unicode.org/reports/tr24/。
Script_Extensions属性是临时的。 它可能会在未来版本的Unicode标准中进行修改或删除,从而在ICU中进行修改或删除。
Parameters | |
---|---|
c |
int : code point |
sc |
int : script code |
Returns | |
---|---|
boolean |
true if sc is in Script_Extensions(c) |
boolean isCased (int script)
如果在脚本案例的现代(或最近)使用情况下习惯使用区分,则返回true。 例如,Latn和Cyrl。
Parameters | |
---|---|
script |
int : script code |
Returns | |
---|---|
boolean |
true if the script is cased |
boolean isRightToLeft (int script)
如果脚本从右向左书写,则返回true。 例如,阿拉伯和希伯来语。
Parameters | |
---|---|
script |
int : script code |
Returns | |
---|---|
boolean |
true if the script is right-to-left |