1.程序员的福音 - Apache Commons Lang
2.java.lang.NoClassDefFoundError: org/apache/commons/logging/LogFactory
3.你知道ApacheCommon包中isNumeric方法是坑吗?
4.StringUtilså¨commons-lang3åcommons-langä¸çåºå«
5.Java必修课判断String是否包含子串的四种方法及性能对比
6.HttpClient4.5使用Commons-logging作为日志记录接口
程序员的福音 - Apache Commons Lang
此文为系列文章的后续篇章,欲了解更多前文内容,请点击链接查阅。
Apache Commons Lang是对Java标准库java.lang的扩展,在commons工具包中,Lang包是海商hishop源码最常用的。
目前Lang包包括commons-lang3和commons-lang两个版本。Lang的最新版本为2.6,适用于Java1.2及以上环境,但官方已不再维护。Lang3的最新版本为3..0,适用于Java8及以上环境,完全支持Java8的特性,并废弃了一些旧的API。由于版本不兼容,autosar源码Lang3更名为lang3以避免冲突。
推荐Java8以上的用户使用lang3代替lang。以下内容以lang3 - 3..0版本为例进行说明。
以下是整体结构:
以下仅列举其中常用功能进行说明,其余功能可自行查阅源码研究。
. 日期相关:在Java8之前,日期处理主要依赖于java.util.Date和java.util.Calendar类,但这两个API存在线程安全问题且不够便捷。Java8推出了新的日期API。如果仍在使用旧的日期API,可以使用DateUtils和DateFormatUtils工具类进行转换和计算。
. 字符串相关:字符串是Java中最常用的类型,相关工具类也最为常用。以下列举了一些常用功能:
1. 字符串判空
2. 字符串去空格
3. 字符串分割
4. 取子字符串
5. 其他功能
6. 随机字符串
. 反射相关:反射是mockmvc 源码Java的重要特性,Lang包中的反射工具类可以方便地实现反射功能。以下列举了一些常用功能:
1. 属性操作
注:方法名含Declared的只会在当前类实例上寻找,不包含Declared的在当前类上找不到则会递归向父类上一直查找。
2. 获取注解方法
3. 方法调用
其他还有ClassUtils,ConstructorUtils,TypeUtils等,不是很常用,有需求的可以现查阅类的源码。
. 系统相关:主要获取操作系统和JVM的一些信息。
. 总结:除了以上介绍的工具类外,还有其他不常用的工具类。感兴趣的用户可以自行查阅源码研究。
java.lang.NoClassDefFoundError: org/apache/commons/logging/LogFactory
å»ä¸è½½ä¸ä¸ªapache commons
mons.apache.org/
log4j.jar
Logging.jar
OK
Log4jæ¯Apacheçä¸ä¸ªå¼æ¾æºä»£ç 项ç®ï¼éè¿ä½¿ç¨Log4jï¼æ们å¯ä»¥æ§å¶æ¥å¿ä¿¡æ¯è¾éçç®çå°æ¯æ§å¶å°ãæ件ãGUIç»ä»¶ãçè³æ¯å¥æ¥å£æå¡å¨ãNTçäºä»¶è®°å½å¨ãUNIX Syslogå®æ¤è¿ç¨çï¼æ们ä¹å¯ä»¥æ§å¶æ¯ä¸æ¡æ¥å¿çè¾åºæ ¼å¼ï¼éè¿å®ä¹æ¯ä¸æ¡æ¥å¿ä¿¡æ¯ç级å«ï¼æ们è½å¤æ´å ç»è´å°æ§å¶æ¥å¿ççæè¿ç¨ãæ令人æå ´è¶£çå°±æ¯ï¼è¿äºå¯ä»¥éè¿ä¸ä¸ªé ç½®æ件æ¥çµæ´»å°è¿è¡é ç½®ï¼èä¸éè¦ä¿®æ¹åºç¨ç代ç ã
static Logger logger = Logger.getLogger(MyApp.class.getName());
logger.info("exception");
你知道ApacheCommon包中isNumeric方法是坑吗?
使用的Apache-Common包的版本是commons-lang-2.6.jar
本文就来分享一个这个坑的情况,以免其它tx也掉坑中
费话不多说,keyhook 源码来看代码: package chapter4; import org.apache.commons.lang.StringUtils; /** * Created by MyWorld on /3/. */ public class StringUtilsIsNumericChecker { public static void main(String[] args) { System.out.println(StringUtils.isNumeric("1")); System.out.println(StringUtils.isNumeric("-1")); } }
围观的tx,认为上面api的输出结果会是什么呢?两个true? 好吧,执行一行看看结果: true false
什么情况,-1不是数字吗? 为什么是false呢 来分析下源码: public static boolean isNumeric(String str) { if (str == null) { return false; } int sz = str.length(); for (int i = 0; i sz; i++) { if (Character.isDigit(str.charAt(i)) == false) { return false; } } return true; }
源码中判断是否数字的依据是JDK的API: java.lang.Character.isDigit(str.charAt(i)) 看看个API的源码: public static boolean isDigit(char ch) { return isDigit((int)ch); }
看看isDigit(int codePoint)的源码: public static boolean isDigit(int codePoint) { boolean bDigit = false; if (codePoint = MIN_CODE_POINT codePoint = FAST_PATH_MAX) { bDigit = CharacterDataLatin1.isDigit(codePoint); } else { int plane = getPlane(codePoint); switch(plane) { case(0): bDigit = CharacterData.isDigit(codePoint); break; case(1): bDigit = CharacterData.isDigit(codePoint); break; case(2): bDigit = CharacterData.isDigit(codePoint); break; case(3): // Undefined case(4): // Undefined case(5): // Undefined case(6): // Undefined case(7): // Undefined case(8): // Undefined case(9): // Undefined case(): // Undefined case(): // Undefined case(): // Undefined case(): // Undefined bDigit = CharacterDataUndefined.isDigit(codePoint); break; case(): bDigit = CharacterData0E.isDigit(codePoint); break; case(): // Private Use case(): // Private Use bDigit = CharacterDataPrivateUse.isDigit(codePoint); break; default: // the argument's plane is invalid, and thus is an invalid codepoint // bDigit remains false; break; } } return bDigit; }
下面还有更深的调用,貌似还涉及到ASCII码了。 水太深,就不继续看了。 有一点是肯定的,这个API不是通过类似Regex expression的方式来判断是数字,而通过每个字符的ASCII的值类确定的 回到API的isNumeric(String str), 看看Doc是怎么说的: /** * pChecks if the String contains only unicode digits. * A decimal point is not a unicode digit and returns false./p * * pcodenull/code will return codefalse/code. * An empty String (length()=0) will return codetrue/code./p * * pre * StringUtils.isNumeric(null) = false * StringUtils.isNumeric("") = true * StringUtils.isNumeric(" ") = false * StringUtils.isNumeric("") = true * StringUtils.isNumeric(" 3") = false * StringUtils.isNumeric("ab2c") = false * StringUtils.isNumeric("-3") = false * StringUtils.isNumeric(".3") = false * /pre * * @param str the String to check, may be null * @return codetrue/code if only contains digits, and is non-null */
看完上面的Doc,感觉水好深。 这个API的方法名直接命名为isInt不就完了。方法名很容易误导人 这也是gmrp源码给开发的tx敲了一个警钟, api使用之前一定要确认清楚,至少看看Doc文档吧
StringUtilså¨commons-lang3åcommons-langä¸çåºå«
ï¼1ï¼å ¥åç±»åä¸åcommons.langä¸å ¥å为 Sring str
commons.lang3ä¸å ¥å为 CharSequence cs(éç¨èå´æ´å¹¿)
ï¼2ï¼å ¥åæ°éä¸å
commons.lang3ä¸æ¯æå¤å ¥å
æè¿ç»å¸¸éè¦å¯¹Stringåä¸äºå¤æåå¤çï¼äºæ¯å°±ç¨å°äºApacheæä¾çStringUtilsè¿ä¸ªå·¥å ·ç±»ï¼ç¨çæ¶ååç°æ两个ä¸åççæ¬ï¼ä¸ä¸ªçæ¬ä½äºorg.apache.commons.langä¸é¢ï¼å¦ä¸ä¸ªåä½äºorg.apache.commons.lang3ä¸é¢ã
æ¥äºä¸ä¸èµæï¼lang3æ¯Apache Commons å¢éåå¸çå·¥å ·å ï¼è¦æ±jdkçæ¬å¨1.5以ä¸ï¼ç¸å¯¹äºlangæ¥è¯´å®å ¨æ¯æjava5çç¹æ§ï¼åºé¤äºä¸äºæ§çAPIã该çæ¬æ æ³å ¼å®¹æ§æçæ¬ï¼äºæ¯ä¸ºäºé¿å å²çªæ¹å为lang3ãè¿äºä¸è¥¿å°±ä¸åç»è¯´äºï¼æ们æ¥ççStringUtilsä¸å¸¸ç¨çä¸äºæ¹æ³æä»ä¹æ¹åå§ã
å¯ä»¥çå°è¿å 个æ¹æ³é»è¾æ¯«æ ååï¼åªæ¯åæ°ç±»ååäºï¼ç±Stringå为CharSequenceãé£ä¹è¿ä¸ªCharSequenceæ¯ä»ä¹å¢ï¼æ们ççå®çæºç ï¼
CharSequenceæ¯ä¸ä¸ªå符åºåçæ¥å£ï¼å ¶ä¸å®ä¹äºä¸äºå¸¸ç¨çå¦length()ãsubSequence()çæ¹æ³ï¼Stringä¹å®ç°äºè¿ä¸ªæ¥å£ãå½ç¶å¤§å®¶å¯è½å¨Stringéç¨å°çé½æ¯subString()ï¼å®é ä¸Stringä¹å®ç°äºsubSequence()è¿ä¸ªæ¹æ³ï¼åªæ¯ç´æ¥æåäºsubString()ã
lang3ä¸ä½¿ç¨CharSequenceæ大ç好å¤å°±æ¯ä»¤è¿äºæ¹æ³ç¨å¤æ´å 广æ³ï¼ä¸æ¢å±éäºStringï¼å ¶ä»ä¸äºå®ç°äºè¯¥æ¥å£çç±»ä¹å¯ä»¥ä½¿ç¨StringUtilsä¸çè¿äºæ¹æ³å»è¿è¡ä¸äºæä½ãå¦å¤æåç°å¾å¤nioä¸çç±»é½å®ç°äºè¿ä¸ªæ¥å£ï¼ä¸ªäººçæµå¯è½ä¹æ为nioæå¡çç®çã
å¨langä¸ï¼ç¬¬ä¸æ¥æ¯å å¤æstr1æ¯å¦ä¸ºç©ºï¼èå¨lang3ä¸ï¼ç¬¬ä¸æ¥åæ¯å å¤æ两个对象æ¯å¦ç¸åãè¿ä¸ªä¸é¾ç解ï¼å¦æ两个对象çå°åç¸åï¼é£ä¹å®ä»¬æåçå°±æ¯åä¸ä¸ªå¯¹è±¡ï¼å 容è¯å®ç¸åã
å¨lang3ä¸ï¼è¿å å ¥äºä¸äºåæ¶å¤æå¤ä¸ªåæ°çæ¹æ³ï¼å¯ä»¥çå°å®é ä¸æ¯å°åæ°å表æ¾å ¥ä¸ä¸ªCharSequenceæ°ç»ä¸ï¼ç¶åéåè°ç¨ä¹åçisEmptyçæ¹æ³ãå¤æblankä¹æ类似çæ¹æ³ã
å¯è½æ人ä¼è§å¾ï¼å¾å¤æ¹æ³Stringæ¬èº«å°±æåï¼ä¸ºä»ä¹è¿è¦ç¨StringUtilsæä¾çå¢ï¼æå¼åæ°ç±»åä¸è°ï¼æ们å¯ä»¥çå°ï¼StringUtilsä¸çæ¹æ³å¤§å¤é½åäºç©ºæ ¡éªï¼å¦æ为空æ¶ä¼è¿åNullæè 空串ï¼èStringæ¬èº«çæ¹æ³å¨å¾å¤ä¼ å ¥åæ°æ对象æ¬èº«ä¸ºç©ºçæ¶åé½ä¼æ¥ç©ºæéé误ã
åèå°åï¼ StringUtilså¨commons-lang3åcommons-langä¸çåºå«
Java必修课判断String是否包含子串的四种方法及性能对比
判断一个字符串是否包含某个特定子串是常见的场景,比如判断一篇文章是否包含敏感词汇、判断日志是否有ERROR信息等。本文将介绍四种方法并进行性能测试。 在String的函数中,提供了indexOf(subStr)方法,返回子串subStr第一次出现的位置,如果不存在则返回-1。例子如下: 最直观判断的方法是contains(subStr),返回类型为boolean,如果包含返回true,不包含则返回false。例子如下: 实际上,String的contains方法是通过调用indexOf方法来判断的,源码如下: 通过强大的正则匹配来判断,虽然有点杀鸡用牛刀的感觉,但也不是不能用,例子如下: Apache的commons-lang3提供许多开箱即用的功能,StringUtils就提供了许多与字符串相关的功能,例子如下: 我们使用JMH工具来对四种方法进行性能测试,Maven引入代码如下: 测试代码如下: 测试结果如下: 最快的就是indexOf方法,其次是contains方法,二者应该没有实际区别,contains是调用indexOf来实现的。Apache的StringUtils为第三方库,相对慢一些。最慢的是使用了正则的Pattern的方法,这不难理解,正则引擎的匹配是比较耗性能的。 本文介绍了判断一个字符串是否包含某个特定子串的四种方法,并通过性能测试进行了对比。其中性能最好的是String的indexOf方法和contains方法,建议使用contains方法,性能好,跟indexOf相比,更直观,更不容易犯错。毕竟让每个人时刻记住返回-1代表不存在也不是一件容易的事。 但是,使用indexOf和contains方法都需要注意做判空处理,这时StringUtils的优势就体现出来了。 总结,四种方法如下:indexOf(subStr):返回子串第一次出现的位置,不存在返回-1。
contains(subStr):返回true或false,是否包含。
Pattern匹配:使用正则匹配,相对耗性能。
StringUtils.contains:Apache库提供,相对慢。
性能测试结果显示,indexOf和contains方法最佳,建议使用contains方法。Apache库的StringUtils方法相对慢,正则匹配方法最慢。在使用方法时,注意处理空值问题。希望本文能帮助你更好地理解和使用这些方法。HttpClient4.5使用Commons-logging作为日志记录接口
Apache HttpClient 4.5采用Commons-logging作为日志记录接口,此接口被广泛应用于日志实现与解耦设计。在org.apache.mons-logging.jar被加入到CLASSPATH后,系统自动猜测并设置所需日志工具,无需额外配置。默认LogFactory按照以下步骤自动发现并决定使用日志实现类: 首先在classpath下查找commons-logging.properties文件,使用其定义的Log实现类。若未找到,则查找是否已定义系统环境变量org.apache.commons.logging.Log,使用其指定的Log实现类。 查看classpath中是否存在Log4j的包,若有,则自动选用Log4j作为日志实现。 若未发现Log4j包,则使用JDK自身的日志实现类(适用于JDK1.4及以上版本)。 若前三种情况均未满足,则使用commons-logging提供的简单日志实现类SimpleLog。 综上,Apache HttpClient 4.5通过Commons-logging接口实现高效灵活的日志管理,简化日志工具的选择与集成过程。