【转】Java检测字符串是否有乱码-白红宇

【转】Java检测字符串是否有乱码

阅读量：5092 次

发布时间：2019-06-13

本文共 1574 字，大约阅读时间需要 5 分钟。

package cn.cnnic.ops.learn;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class Luanma {

/**

* 判断字符是否是中文

* @param c 字符

* @return 是否是中文

public static boolean isChinese(char c) {

Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);

if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS

|| ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS

|| ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A

|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION

|| ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION

|| ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {

return true;

}

return false;

}

/**

* 判断字符串是否是乱码

* @param strName 字符串

* @return 是否是乱码

public static boolean isMessyCode(String strName) {

Pattern p = Pattern.compile("\\s*|t*|r*|n*");

Matcher m = p.matcher(strName);

String after = m.replaceAll("");

String temp = after.replaceAll("\\p{P}", "");

char[] ch = temp.trim().toCharArray();

float chLength = ch.length;

float count = 0;

for (int i = 0; i < ch.length; i++) {

char c = ch[i];

if (!Character.isLetterOrDigit(c)) {

if (!isChinese(c)) {

count = count + 1;

}

float result = count / chLength;

if (result > 0.4) {

return true;

} else {

return false;

}

public static void main(String[] args) {

System.out.println(isMessyCode("Ã©Å¸Â©Ã©Â¡ÂºÃ¥Â¹Â³"));

System.out.println(isMessyCode("abcd"));

System.out.println(isMessyCode("你好"));

}

【转自】http://blog.icoolxue.com/java-to-determine-whether-a-string-is-garbled-pro-testing-available/

放着，待用。

转载于:https://www.cnblogs.com/zhzhang/p/5543309.html

你可能感兴趣的文章

Aizu - 1378 Secret of Chocolate Poles （DP）

window.event在IE和Firefox的异同

查看>>

常见的js算法面试题收集，es6实现

查看>>

IO流写出到本地 D盘demoIO.txt 文本中

查看>>

Windows10 下Apache服务器搭建

solr后台操作Documents之增删改查

（转）linux sort,uniq,cut,wc命令详解

查看>>