package x2;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;
import tool.readfile;
import java.io.File;
public class pro {
int s,datanumber,number;
String[] data=new String[5000];
String[] name=new String[5000];
String[] wiki=new String[5000];
String[] title=new String[5000];
String[] code=new String[5000];
public static void main(String[] args) {
pro t=new pro();
}
pro(){
File f=new File("data");
String[] ff=f.list();
int sx=0;
int tr;
for(tr=0;tr<ff.length;tr++){
readfile sub2=new readfile();
sub2.makedata("data/"+ff[tr],"UTF-8");
data=sub2.data;
datanumber=sub2.datanumber;
String cc=ff[tr].replace(".txt","");
String t="";
for(s=1;s<datanumber+1;s++){
if(data[s].indexOf("<title>")>-1)t=data[s];
}
int q1=t.indexOf("<title>");
int q2=t.indexOf("- Wikipedia",q1);
if(q1>-1)t=t.substring(q1,q2);
t=t.replace("<title>","");
System.out.println(t);
int s1=0;
for(s=1;s<datanumber+1;s++){
int h=0;
if(data[s].indexOf("出演")>-1)h=h+1;
if(data[s].indexOf("mw-headline")>-1)h=h+1;
if(data[s].indexOf("<h2>")>-1)h=h+1;
if(s1==0)h=h+1;
if(h==4)s1=s;
}
int s2=0;
for(s=s1+1;s<datanumber+1;s++){
int h=0;
if(s2==0)h=h+1;
if(data[s].indexOf("mw-headline")>-1)h=h+1;
if(data[s].indexOf("h2")>-1)h=h+1;
if(h==3)s2=s;
}
String str="";
for(s=s1+1;s<s2;s++){
if(s1>0)str=str+data[s];
}
String[] x=str.split("</li>");
for(s=0;s<x.length-1;s++){
int p1=x[s].indexOf("/wiki/");
int p2=-1;
if(p1>-1)p2=x[s].indexOf(">",p1);
p2=x[s].indexOf(">",p1);
int p3=x[s].indexOf("</a>",p2);
int p4=x[s].indexOf("\"",p1);
String z="";
if(p1>-1)z=x[s].substring(p2+1,p3);
String z1="";
if(p1>-1)z1="https://ja.wikipedia.org"+x[s].substring(p1,p4);
if(z.length()>0)sx=sx+1;
if(z.length()>0)name[sx]=z;
if(z.length()>0)wiki[sx]=z1;
if(z.length()>0)title[sx]=t;
if(z.length()>0)code[sx]=cc;
}
}
number=sx;
writexml("data.csv");
}
void writexml(String file){
int s,sx;
try{
PrintWriter pw = new PrintWriter (new BufferedWriter(new FileWriter(file)));
for(s=1;s<number+1;s++){
pw.println(title[s]+","+code[s]+","+name[s]+","+wiki[s]);
}
System.out.println("ファイルに書きこみました。");
pw.close();
} catch(IOException ep){ System.out.println("入出力エラーです。"); }
}
}
最終更新:2017年05月29日 10:36