String.indexOf + .substring med UTF8 strenge

Michael Berg · May 30, 2004

Hej Alle,

Hvordan er det lige at String.indexOf() virker sammen med UTF-8 strenge?

Jeg sidder med en ret triviel search-and-replace strengrutine, men oplever
nogle mystiske ting når jeg begynder at arbejde med strenge, der indeholder
UTF-8. Det er næsten som om at den position som String.indexOf() returnerer
ikke svarer til hvad man så efterfølgende kan hive ud med
String.substring(). Altså:

String utfstring = "abcabcabc<utf8-volapyk>defdef";
int a = utfstring.indexOf("def");
utfstring.substring(a,a+6) != defdef .... ????

Er der nogen der ved hvordan det helt præcist forholder sig med indexOf og
substring i relation til UTF-8 strenge?

Det ville også være super hvis en eller anden havde en (hurtig!)
replacesubstring dims, der selvfølgelig også virker med UTF-8. Eneste
alternativ jeg kan se er at hive strengen over i en byte array og løbe den
igennem tegn for tegn, og det kan jeg ikke forestille mig vil performe
specielt godt.

Mvh
/Michael

Add recipes using JavaScript in table	20	Apr 17, 2023
Eksternt program, STDIO & STDIN	0	Oct 17, 2006
How do i create "Sub-links" ?	3	Dec 15, 2006
Namespace and Import woes	0	Aug 29, 2006
apache ant	0	Oct 30, 2005
Readfile i PHP, har ASP noe lignende?	1	Nov 24, 2008
Include virtual	3	Dec 1, 2003
Aktier med Bäst Avkastning	0	Sep 7, 2010

String.indexOf + .substring med UTF8 strenge

Michael Berg

Ask a Question

Similar Threads

Members online

Forum statistics

Latest Threads