java – 将字符串分成所有可能的4个字母的后续短语
发布时间:2020-12-15 04:27:06 所属栏目:Java 来源:网络整理
导读:我想要做的基本上是这样的: 读一个文件; 删除所有标点符号并将所有字母转换为小写; 将单词转换为4个字母短语(如果单词短于4个字符,则将其作为一个整体); 例: Input: Hello,my identification is Mister Dude. Output: hell,ello,my,iden,dent,enti,ntif,ti
|
我想要做的基本上是这样的:
>读一个文件; 例:
如果我能将每个4字短语作为数组中的单独值,那将是很好的. 现在我设法完成的事情: public String[] OpenFile() throws IOException {
FileReader fr = new FileReader(path);
BufferedReader textReader = new BufferedReader(fr);
int numberOfLines = readLines();
String[] textData = new String[numberOfLines];
int i;
for (i = 0; i < numberOfLines; i++) {
textData[i] = textReader.readLine();
textData[i] = textData[i].replaceAll("[^A-Za-z???????ū?]+"," ").toLowerCase();
}
textReader.close();
return textData;
}
textData [i]是我需要划分的每行文本. 解决方法
测试
ideone.com:
public static void main (String[] args) {
String text = "Hello,my identification is Mister Dude.";
String[] words = text.replaceAll("[^(w )]+","").toLowerCase().split(" ");
for (String word : words) {
if (word.length() <= 4) {
System.out.println(word);
}
else {
for (int i = 0; i <= word.length() - 4; i++) {
System.out.println(word.substring(i,i + 4));
}
}
}
}
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
