पहला अद्यतन: इससे पहले कि आप उत्पादन के माहौल में इसकी कोशिश करें (सलाह नहीं दी गई), पहले इसे पढ़ें: http://www.javaspecialists.eu/archive/Issue237.html
जावा 9 से शुरू, वर्णित समाधान अब और काम नहीं करेगा। , क्योंकि अब जावा डिफ़ॉल्ट रूप से बाइट्स [] को स्टोर करेगा।
दूसरा अद्यतन: 2016-10-25 के अनुसार, मेरे AMDx64 8core और स्रोत 1.8 पर, 'charAt' और फ़ील्ड एक्सेस का उपयोग करने में कोई अंतर नहीं है। ऐसा प्रतीत होता है कि jvm पर्याप्त रूप से इनलाइन के लिए अनुकूलित है और किसी भी 'string.charAt (n)' कॉल को कारगर बनाता है।
यह सब String
निरीक्षण किया जा रहा है की लंबाई पर निर्भर करता है । यदि, जैसा कि सवाल कहता है, यह लंबे तार के लिए है, स्ट्रिंग का निरीक्षण करने का सबसे तेज़ तरीका स्ट्रिंग का समर्थन करने के लिए प्रतिबिंब का उपयोग करना है char[]
।
JDK 8 (win32 और win64) के साथ 64 AMD Phenom II 4 core 955 @ 3.2 GHZ (क्लाइंट मोड और सर्वर मोड दोनों में) पर 9 अलग-अलग तकनीकों के साथ एक पूरी तरह से यादृच्छिक बेंचमार्क (नीचे देखें!) दिखाता है कि उपयोग String.charAt(n)
करना सबसे छोटा है! तार और उस reflection
स्ट्रिंग स्ट्रिंग ऐक्सेस का उपयोग करने के लिए बड़े स्ट्रिंग्स के लिए लगभग दोगुना तेज है।
प्रयोग
9 विभिन्न अनुकूलन तकनीकों की कोशिश की जाती है।
सभी स्ट्रिंग सामग्री यादृच्छिक हैं
परीक्षण 0,1,2,4,8,16 आदि के साथ दो के गुणकों में स्ट्रिंग आकार के लिए किया जाता है।
परीक्षण प्रति स्ट्रिंग आकार में 1,000 गुना किया जाता है
परीक्षणों को हर बार यादृच्छिक क्रम में बदल दिया जाता है। दूसरे शब्दों में, परीक्षण हर बार किए जाने वाले यादृच्छिक क्रम में 1000 बार से अधिक किए जाते हैं।
अनुकूलन और समय पर जेवीएम वार्मअप के प्रभाव को दिखाने के लिए पूरे परीक्षण सूट को आगे और पीछे किया जाता है।
संपूर्ण सुइट दो बार किया जाता है, एक बार -client
मोड में और दूसरा -server
मोड में।
निष्कर्ष
-क्लायंट मोड (32 बिट)
तार के लिए लंबाई में 1 256 अक्षरों , बुला string.charAt(i)
प्रति सेकंड 1.34 करोड़ 588 मिलियन करने के लिए पात्रों के एक औसत प्रसंस्करण के साथ जीतता है।
इसके अलावा, यह कुल मिलाकर 5.5% तेज (क्लाइंट) और 13.9% (सर्वर) इस तरह है:
for (int i = 0; i < data.length(); i++) {
if (data.charAt(i) <= ' ') {
doThrow();
}
}
स्थानीय अंतिम लंबाई चर के साथ इस तरह से:
final int len = data.length();
for (int i = 0; i < len; i++) {
if (data.charAt(i) <= ' ') {
doThrow();
}
}
लंबे स्ट्रिंग्स के लिए, 512 से 256K वर्ण लंबाई , स्ट्रिंग के बैकिंग सरणी तक पहुंचने के लिए प्रतिबिंब का उपयोग करना सबसे तेज़ है। यह तकनीक String.charAt (i) (178% तेजी) से लगभग दोगुनी है । इस सीमा पर औसत गति 1.111 बिलियन वर्ण प्रति सेकंड थी।
फ़ील्ड को समय से पहले प्राप्त किया जाना चाहिए और फिर इसे अलग-अलग तारों पर लाइब्रेरी में फिर से उपयोग किया जा सकता है। दिलचस्प बात यह है कि फील्ड एक्सेस के साथ ऊपर दिए गए कोड के विपरीत, लूप की जांच में 'charllength' का उपयोग करने की तुलना में स्थानीय अंतिम लंबाई चर का 9% तेजी से होना है। यहां बताया गया है कि फ़ील्ड एक्सेस को सबसे तेज़ कैसे सेटअप किया जा सकता है:
final Field field = String.class.getDeclaredField("value");
field.setAccessible(true);
try {
final char[] chars = (char[]) field.get(data);
final int len = chars.length;
for (int i = 0; i < len; i++) {
if (chars[i] <= ' ') {
doThrow();
}
}
return len;
} catch (Exception ex) {
throw new RuntimeException(ex);
}
विशेष टिप्पणियाँ -server मोड पर
मेरे एएमडी 64 मशीन पर 64 बिट जावा मशीन पर सर्वर मोड में 32 चरित्र की लंबाई के तार के बाद जीतना शुरू करना। क्लाइंट मोड में 512 वर्णों की लंबाई तक इसे नहीं देखा गया था।
यह भी ध्यान देने योग्य है कि मुझे लगता है, जब मैं सर्वर मोड में JDK 8 (32 बिट बिल्ड) चला रहा था, तो समग्र प्रदर्शन बड़े और छोटे दोनों तारों के लिए 7% धीमा था। यह JDK 8 के शुरुआती रिलीज के 121 दिसंबर 2013 के निर्माण के साथ था। तो, अब के लिए, ऐसा लगता है कि 32 बिट सर्वर मोड 32 बिट क्लाइंट मोड से धीमा है।
यह कहा जा रहा है ... यह केवल सर्वर मोड लगता है जो मूल्य के लिए 64 बिट मशीन पर है। अन्यथा यह वास्तव में प्रदर्शन को बाधित करता है।
32 बिट निर्माण के लिए -server mode
एक AMD64 पर चल रहा है, मैं यह कह सकता हूँ:
- String.charAt (i) कुल मिलाकर स्पष्ट विजेता है। हालाँकि आकार 8 से 512 वर्णों के बीच 'नए' 'पुन: उपयोग' और 'क्षेत्र' के बीच विजेता थे।
- String.charAt (i) क्लाइंट मोड में 45% तेज है
- क्लाइंट मोड में बड़े स्ट्रिंग्स के लिए फ़ील्ड एक्सेस दोगुना है।
इसके अलावा कहने लायक, String.chars () (स्ट्रीम और समानांतर संस्करण) एक बस्ट हैं। किसी भी अन्य तरीके की तुलना में धीमी। Streams
एपीआई एक नहीं बल्कि धीमी गति से जिस तरह से सामान्य स्ट्रिंग कार्रवाई करने के लिए है।
काश सूची
जावा स्ट्रिंग में अनुकूलित तरीकों को स्वीकार करने की भविष्यवाणी हो सकती है जैसे (विधेय), forEach (उपभोक्ता), forEachWithIndex (उपभोक्ता)। इस प्रकार, उपयोगकर्ता को स्ट्रिंग विधियों के लिए लंबाई या दोहराने कॉल जानने की आवश्यकता के बिना, ये पुस्तकालयों की beep-beep beep
गति को पार्स करने में मदद कर सकते हैं ।
सपने देखते रहो :)
हैप्पी स्ट्रिंग्स!
~ एसएच
परीक्षण ने व्हॉट्सएप की उपस्थिति के लिए स्ट्रिंग के परीक्षण के निम्नलिखित 9 तरीकों का इस्तेमाल किया:
"charAt1" - वास्तविक समय में STRING सामग्री का चयन करें:
int charAtMethod1(final String data) {
final int len = data.length();
for (int i = 0; i < len; i++) {
if (data.charAt(i) <= ' ') {
doThrow();
}
}
return len;
}
"charAt2" - ABEE BUT USE String.length () के समान ही LENGTh के लिए एक फाइनल लॉजिकल इंट बनाने की योजना
int charAtMethod2(final String data) {
for (int i = 0; i < data.length(); i++) {
if (data.charAt(i) <= ' ') {
doThrow();
}
}
return data.length();
}
"स्ट्रीम" - नई जावा -8 स्ट्रिंग के इंट्रीस्ट्रीम का उपयोग करें और इसे चेक करने के लिए एक आवश्यक तरीका बताएं
int streamMethod(final String data, final IntPredicate predicate) {
if (data.chars().anyMatch(predicate)) {
doThrow();
}
return data.length();
}
"स्ट्रीमपारा" - समान के रूप में, लेकिन ओह-ला-ला - जाओ PARALLEL !!!
// avoid this at all costs
int streamParallelMethod(final String data, IntPredicate predicate) {
if (data.chars().parallel().anyMatch(predicate)) {
doThrow();
}
return data.length();
}
"पुन: उपयोग" - STRING सामग्री के साथ एक पुन: प्रयोज्य चार []
int reuseBuffMethod(final char[] reusable, final String data) {
final int len = data.length();
data.getChars(0, len, reusable, 0);
for (int i = 0; i < len; i++) {
if (reusable[i] <= ' ') {
doThrow();
}
}
return len;
}
"new1" - OBTAIN चार का एक नया कॉपी [] STRING से
int newMethod1(final String data) {
final int len = data.length();
final char[] copy = data.toCharArray();
for (int i = 0; i < len; i++) {
if (copy[i] <= ' ') {
doThrow();
}
}
return len;
}
"new2" - समान के रूप में, लेकिन उपयोग "फॉर-एक"
int newMethod2(final String data) {
for (final char c : data.toCharArray()) {
if (c <= ' ') {
doThrow();
}
}
return data.length();
}
"फ़ील्ड 1" - फैंसी !! स्ट्रोंग'स इंटर्नल चार के लिए OBTAIN FIELD
int fieldMethod1(final Field field, final String data) {
try {
final char[] chars = (char[]) field.get(data);
final int len = chars.length;
for (int i = 0; i < len; i++) {
if (chars[i] <= ' ') {
doThrow();
}
}
return len;
} catch (Exception ex) {
throw new RuntimeException(ex);
}
}
"फ़ील्ड 2" - समान के रूप में, लेकिन उपयोग "फॉर-एच"
int fieldMethod2(final Field field, final String data) {
final char[] chars;
try {
chars = (char[]) field.get(data);
} catch (Exception ex) {
throw new RuntimeException(ex);
}
for (final char c : chars) {
if (c <= ' ') {
doThrow();
}
}
return chars.length;
}
ग्राहक के लिए समग्र परिणाम -client
मोड के (आगे और पीछे के परीक्षण संयुक्त)
नोट: जावा -32 बिट के साथ -client मोड और जावा 64 बिट के साथ -server मोड मेरे AMD64 मशीन पर नीचे के समान हैं।
Size WINNER charAt1 charAt2 stream streamPar reuse new1 new2 field1 field2
1 charAt 77.0 72.0 462.0 584.0 127.5 89.5 86.0 159.5 165.0
2 charAt 38.0 36.5 284.0 32712.5 57.5 48.3 50.3 89.0 91.5
4 charAt 19.5 18.5 458.6 3169.0 33.0 26.8 27.5 54.1 52.6
8 charAt 9.8 9.9 100.5 1370.9 17.3 14.4 15.0 26.9 26.4
16 charAt 6.1 6.5 73.4 857.0 8.4 8.2 8.3 13.6 13.5
32 charAt 3.9 3.7 54.8 428.9 5.0 4.9 4.7 7.0 7.2
64 charAt 2.7 2.6 48.2 232.9 3.0 3.2 3.3 3.9 4.0
128 charAt 2.1 1.9 43.7 138.8 2.1 2.6 2.6 2.4 2.6
256 charAt 1.9 1.6 42.4 90.6 1.7 2.1 2.1 1.7 1.8
512 field1 1.7 1.4 40.6 60.5 1.4 1.9 1.9 1.3 1.4
1,024 field1 1.6 1.4 40.0 45.6 1.2 1.9 2.1 1.0 1.2
2,048 field1 1.6 1.3 40.0 36.2 1.2 1.8 1.7 0.9 1.1
4,096 field1 1.6 1.3 39.7 32.6 1.2 1.8 1.7 0.9 1.0
8,192 field1 1.6 1.3 39.6 30.5 1.2 1.8 1.7 0.9 1.0
16,384 field1 1.6 1.3 39.8 28.4 1.2 1.8 1.7 0.8 1.0
32,768 field1 1.6 1.3 40.0 26.7 1.3 1.8 1.7 0.8 1.0
65,536 field1 1.6 1.3 39.8 26.3 1.3 1.8 1.7 0.8 1.0
131,072 field1 1.6 1.3 40.1 25.4 1.4 1.9 1.8 0.8 1.0
262,144 field1 1.6 1.3 39.6 25.2 1.5 1.9 1.9 0.8 1.0
सर्वर के लिए समग्र परिणाम -server
मोड के (आगे और पीछे संयुक्त परीक्षण)
नोट: यह एक AMD64 पर सर्वर मोड में चल रहे जावा 32 बिट के लिए परीक्षण है। जावा 64 बिट के लिए सर्वर मोड क्लाइंट मोड में जावा 32 बिट के समान ही था, सिवाय इसके कि फ़ील्ड एक्सेस 32 अक्षरों के आकार के बाद जीतना शुरू करता है।
Size WINNER charAt1 charAt2 stream streamPar reuse new1 new2 field1 field2
1 charAt 74.5 95.5 524.5 783.0 90.5 102.5 90.5 135.0 151.5
2 charAt 48.5 53.0 305.0 30851.3 59.3 57.5 52.0 88.5 91.8
4 charAt 28.8 32.1 132.8 2465.1 37.6 33.9 32.3 49.0 47.0
8 new2 18.0 18.6 63.4 1541.3 18.5 17.9 17.6 25.4 25.8
16 new2 14.0 14.7 129.4 1034.7 12.5 16.2 12.0 16.0 16.6
32 new2 7.8 9.1 19.3 431.5 8.1 7.0 6.7 7.9 8.7
64 reuse 6.1 7.5 11.7 204.7 3.5 3.9 4.3 4.2 4.1
128 reuse 6.8 6.8 9.0 101.0 2.6 3.0 3.0 2.6 2.7
256 field2 6.2 6.5 6.9 57.2 2.4 2.7 2.9 2.3 2.3
512 reuse 4.3 4.9 5.8 28.2 2.0 2.6 2.6 2.1 2.1
1,024 charAt 2.0 1.8 5.3 17.6 2.1 2.5 3.5 2.0 2.0
2,048 charAt 1.9 1.7 5.2 11.9 2.2 3.0 2.6 2.0 2.0
4,096 charAt 1.9 1.7 5.1 8.7 2.1 2.6 2.6 1.9 1.9
8,192 charAt 1.9 1.7 5.1 7.6 2.2 2.5 2.6 1.9 1.9
16,384 charAt 1.9 1.7 5.1 6.9 2.2 2.5 2.5 1.9 1.9
32,768 charAt 1.9 1.7 5.1 6.1 2.2 2.5 2.5 1.9 1.9
65,536 charAt 1.9 1.7 5.1 5.5 2.2 2.4 2.4 1.9 1.9
131,072 charAt 1.9 1.7 5.1 5.4 2.3 2.5 2.5 1.9 1.9
262,144 charAt 1.9 1.7 5.1 5.1 2.3 2.5 2.5 1.9 1.9
पूरी तरह से विश्वसनीय कार्यक्रम
(जावा 7 और इससे पहले परीक्षण करने के लिए, दो स्ट्रीम परीक्षण हटाएं)
import java.lang.reflect.Field;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
import java.util.Random;
import java.util.function.IntPredicate;
/**
* @author Saint Hill <http://stackoverflow.com/users/1584255/saint-hill>
*/
public final class TestStrings {
// we will not test strings longer than 512KM
final int MAX_STRING_SIZE = 1024 * 256;
// for each string size, we will do all the tests
// this many times
final int TRIES_PER_STRING_SIZE = 1000;
public static void main(String[] args) throws Exception {
new TestStrings().run();
}
void run() throws Exception {
// double the length of the data until it reaches MAX chars long
// 0,1,2,4,8,16,32,64,128,256 ...
final List<Integer> sizes = new ArrayList<>();
for (int n = 0; n <= MAX_STRING_SIZE; n = (n == 0 ? 1 : n * 2)) {
sizes.add(n);
}
// CREATE RANDOM (FOR SHUFFLING ORDER OF TESTS)
final Random random = new Random();
System.out.println("Rate in nanoseconds per character inspected.");
System.out.printf("==== FORWARDS (tries per size: %s) ==== \n", TRIES_PER_STRING_SIZE);
printHeadings(TRIES_PER_STRING_SIZE, random);
for (int size : sizes) {
reportResults(size, test(size, TRIES_PER_STRING_SIZE, random));
}
// reverse order or string sizes
Collections.reverse(sizes);
System.out.println("");
System.out.println("Rate in nanoseconds per character inspected.");
System.out.printf("==== BACKWARDS (tries per size: %s) ==== \n", TRIES_PER_STRING_SIZE);
printHeadings(TRIES_PER_STRING_SIZE, random);
for (int size : sizes) {
reportResults(size, test(size, TRIES_PER_STRING_SIZE, random));
}
}
///
///
/// METHODS OF CHECKING THE CONTENTS
/// OF A STRING. ALWAYS CHECKING FOR
/// WHITESPACE (CHAR <=' ')
///
///
// CHECK THE STRING CONTENTS
int charAtMethod1(final String data) {
final int len = data.length();
for (int i = 0; i < len; i++) {
if (data.charAt(i) <= ' ') {
doThrow();
}
}
return len;
}
// SAME AS ABOVE BUT USE String.length()
// instead of making a new final local int
int charAtMethod2(final String data) {
for (int i = 0; i < data.length(); i++) {
if (data.charAt(i) <= ' ') {
doThrow();
}
}
return data.length();
}
// USE new Java-8 String's IntStream
// pass it a PREDICATE to do the checking
int streamMethod(final String data, final IntPredicate predicate) {
if (data.chars().anyMatch(predicate)) {
doThrow();
}
return data.length();
}
// OH LA LA - GO PARALLEL!!!
int streamParallelMethod(final String data, IntPredicate predicate) {
if (data.chars().parallel().anyMatch(predicate)) {
doThrow();
}
return data.length();
}
// Re-fill a resuable char[] with the contents
// of the String's char[]
int reuseBuffMethod(final char[] reusable, final String data) {
final int len = data.length();
data.getChars(0, len, reusable, 0);
for (int i = 0; i < len; i++) {
if (reusable[i] <= ' ') {
doThrow();
}
}
return len;
}
// Obtain a new copy of char[] from String
int newMethod1(final String data) {
final int len = data.length();
final char[] copy = data.toCharArray();
for (int i = 0; i < len; i++) {
if (copy[i] <= ' ') {
doThrow();
}
}
return len;
}
// Obtain a new copy of char[] from String
// but use FOR-EACH
int newMethod2(final String data) {
for (final char c : data.toCharArray()) {
if (c <= ' ') {
doThrow();
}
}
return data.length();
}
// FANCY!
// OBTAIN FIELD FOR ACCESS TO THE STRING'S
// INTERNAL CHAR[]
int fieldMethod1(final Field field, final String data) {
try {
final char[] chars = (char[]) field.get(data);
final int len = chars.length;
for (int i = 0; i < len; i++) {
if (chars[i] <= ' ') {
doThrow();
}
}
return len;
} catch (Exception ex) {
throw new RuntimeException(ex);
}
}
// same as above but use FOR-EACH
int fieldMethod2(final Field field, final String data) {
final char[] chars;
try {
chars = (char[]) field.get(data);
} catch (Exception ex) {
throw new RuntimeException(ex);
}
for (final char c : chars) {
if (c <= ' ') {
doThrow();
}
}
return chars.length;
}
/**
*
* Make a list of tests. We will shuffle a copy of this list repeatedly
* while we repeat this test.
*
* @param data
* @return
*/
List<Jobber> makeTests(String data) throws Exception {
// make a list of tests
final List<Jobber> tests = new ArrayList<Jobber>();
tests.add(new Jobber("charAt1") {
int check() {
return charAtMethod1(data);
}
});
tests.add(new Jobber("charAt2") {
int check() {
return charAtMethod2(data);
}
});
tests.add(new Jobber("stream") {
final IntPredicate predicate = new IntPredicate() {
public boolean test(int value) {
return value <= ' ';
}
};
int check() {
return streamMethod(data, predicate);
}
});
tests.add(new Jobber("streamPar") {
final IntPredicate predicate = new IntPredicate() {
public boolean test(int value) {
return value <= ' ';
}
};
int check() {
return streamParallelMethod(data, predicate);
}
});
// Reusable char[] method
tests.add(new Jobber("reuse") {
final char[] cbuff = new char[MAX_STRING_SIZE];
int check() {
return reuseBuffMethod(cbuff, data);
}
});
// New char[] from String
tests.add(new Jobber("new1") {
int check() {
return newMethod1(data);
}
});
// New char[] from String
tests.add(new Jobber("new2") {
int check() {
return newMethod2(data);
}
});
// Use reflection for field access
tests.add(new Jobber("field1") {
final Field field;
{
field = String.class.getDeclaredField("value");
field.setAccessible(true);
}
int check() {
return fieldMethod1(field, data);
}
});
// Use reflection for field access
tests.add(new Jobber("field2") {
final Field field;
{
field = String.class.getDeclaredField("value");
field.setAccessible(true);
}
int check() {
return fieldMethod2(field, data);
}
});
return tests;
}
/**
* We use this class to keep track of test results
*/
abstract class Jobber {
final String name;
long nanos;
long chars;
long runs;
Jobber(String name) {
this.name = name;
}
abstract int check();
final double nanosPerChar() {
double charsPerRun = chars / runs;
long nanosPerRun = nanos / runs;
return charsPerRun == 0 ? nanosPerRun : nanosPerRun / charsPerRun;
}
final void run() {
runs++;
long time = System.nanoTime();
chars += check();
nanos += System.nanoTime() - time;
}
}
// MAKE A TEST STRING OF RANDOM CHARACTERS A-Z
private String makeTestString(int testSize, char start, char end) {
Random r = new Random();
char[] data = new char[testSize];
for (int i = 0; i < data.length; i++) {
data[i] = (char) (start + r.nextInt(end));
}
return new String(data);
}
// WE DO THIS IF WE FIND AN ILLEGAL CHARACTER IN THE STRING
public void doThrow() {
throw new RuntimeException("Bzzzt -- Illegal Character!!");
}
/**
* 1. get random string of correct length 2. get tests (List<Jobber>) 3.
* perform tests repeatedly, shuffling each time
*/
List<Jobber> test(int size, int tries, Random random) throws Exception {
String data = makeTestString(size, 'A', 'Z');
List<Jobber> tests = makeTests(data);
List<Jobber> copy = new ArrayList<>(tests);
while (tries-- > 0) {
Collections.shuffle(copy, random);
for (Jobber ti : copy) {
ti.run();
}
}
// check to make sure all char counts the same
long runs = tests.get(0).runs;
long count = tests.get(0).chars;
for (Jobber ti : tests) {
if (ti.runs != runs && ti.chars != count) {
throw new Exception("Char counts should match if all correct algorithms");
}
}
return tests;
}
private void printHeadings(final int TRIES_PER_STRING_SIZE, final Random random) throws Exception {
System.out.print(" Size");
for (Jobber ti : test(0, TRIES_PER_STRING_SIZE, random)) {
System.out.printf("%9s", ti.name);
}
System.out.println("");
}
private void reportResults(int size, List<Jobber> tests) {
System.out.printf("%6d", size);
for (Jobber ti : tests) {
System.out.printf("%,9.2f", ti.nanosPerChar());
}
System.out.println("");
}
}
for (char c : chars)
?