博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pinyin4j的使用
阅读量:6644 次
发布时间:2019-06-25

本文共 2077 字,大约阅读时间需要 6 分钟。

pinyin4j的使用
 
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
 
 
import net.sourceforge.pinyin4j.PinyinHelper; 
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 
import java.io.UnsupportedEncodingException; 
/** 
* 拼音工具 
*/
 
public 
class PinyinToolkit { 
        
/** 
         * 获取汉字串拼音首字母,英文字符不变 
         * 
         * @param chinese 汉字串 
         * @return 汉语拼音首字母 
         */
 
        
public 
static String cn2FirstSpell(String chinese) { 
                StringBuffer pybf = 
new StringBuffer(); 
                
char[] arr = chinese.toCharArray(); 
                HanyuPinyinOutputFormat defaultFormat = 
new HanyuPinyinOutputFormat(); 
                defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
                defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 
                
for (
int i = 0; i < arr.length; i++) { 
                        
if (arr[i] > 128) { 
                                
try { 
                                        String[] _t = PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat); 
                                        
if (_t != 
null) { 
                                                pybf.append(_t[0].charAt(0)); 
                                        } 
                                } 
catch (BadHanyuPinyinOutputFormatCombination e) { 
                                        e.printStackTrace(); 
                                } 
                        } 
else { 
                                pybf.append(arr[i]); 
                        } 
                } 
                
return pybf.toString().replaceAll(
"\\W", "").trim(); 
        } 
        
/** 
         * 获取汉字串拼音,英文字符不变 
         * 
         * @param chinese 汉字串 
         * @return 汉语拼音 
         */
 
        
public 
static String cn2Spell(String chinese) { 
                StringBuffer pybf = 
new StringBuffer(); 
                
char[] arr = chinese.toCharArray(); 
                HanyuPinyinOutputFormat defaultFormat = 
new HanyuPinyinOutputFormat(); 
                defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
                defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 
                
for (
int i = 0; i < arr.length; i++) { 
                        
if (arr[i] > 128) { 
                                
try { 
                                        pybf.append(PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat)[0]); 
                                } 
catch (BadHanyuPinyinOutputFormatCombination e) { 
                                        e.printStackTrace(); 
                                } 
                        } 
else { 
                                pybf.append(arr[i]); 
                        } 
                } 
                
return pybf.toString(); 
        } 
        
public 
static 
void main(String[] args) 
throws UnsupportedEncodingException { 
                String x = 
"中国你好"
                System.out.println(cn2FirstSpell(x)); 
                System.out.println(cn2Spell(x)); 
        } 
}
  
在某些系统上可能有字符集的问题,需要做预处理。

 

转载地址:http://bpevo.baihongyu.com/

你可能感兴趣的文章
我的友情链接
查看>>
系统架构图怎么画
查看>>
一个很酷的加载loading效果
查看>>
我的友情链接
查看>>
Java解析json串
查看>>
ubuntu12.04 NFS搭建指南
查看>>
Sublime Text 使用介绍、全套快捷键及插件推荐
查看>>
toolbar
查看>>
spring boot 项目,maven打jar包时,将本地jar一块打入包
查看>>
Exchange Server 2010 SP2 高可用性(八)---配置内外网邮件收发
查看>>
Windows Server 2012 虚拟化实战:存储(一)
查看>>
linux shell 计算时间差并显示按时分秒显示
查看>>
iptables防火墙
查看>>
最大子序列和问题的解——C++实现;
查看>>
Shell脚本语言
查看>>
.NET快速开发平台,开发效率倍增神器
查看>>
阿里云 Aliplayer高级功能介绍(六):进度条标记
查看>>
【Python学习笔记】数据结构—序列——list列表和tuple元组
查看>>
Oracle 11G r2 Rac修改IP
查看>>
netstat TIME_WAIT
查看>>