アットウィキロゴ

dlx99

package x2;
 
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;
import tool.readfile;
import java.io.File;
 
 
public class pro {
 
      int s,datanumber,number;
    String[] data=new String[5000];
    String[] name=new String[5000];
    String[] wiki=new String[5000];
 
    String[] title=new String[5000];
    String[] code=new String[5000];
 
    public static void main(String[] args) {
        pro t=new pro();
    }
 
    pro(){
 
        File f=new File("data");
        String[] ff=f.list();
 
 
 
        int sx=0;
 
        int tr;
        for(tr=0;tr<ff.length;tr++){
 
 
    readfile sub2=new readfile();
   sub2.makedata("data/"+ff[tr],"UTF-8");
   data=sub2.data;
   datanumber=sub2.datanumber;
 
   String cc=ff[tr].replace(".txt","");
 
   String t="";
 
   for(s=1;s<datanumber+1;s++){   
if(data[s].indexOf("<title>")>-1)t=data[s];
}
 
   int q1=t.indexOf("<title>");
   int q2=t.indexOf("- Wikipedia",q1);
 
   if(q1>-1)t=t.substring(q1,q2);
   t=t.replace("<title>","");
 
   System.out.println(t);
 
 
 
   int s1=0;
for(s=1;s<datanumber+1;s++){   
int h=0;
if(data[s].indexOf("出演")>-1)h=h+1;
if(data[s].indexOf("mw-headline")>-1)h=h+1;
if(data[s].indexOf("<h2>")>-1)h=h+1;
if(s1==0)h=h+1;
if(h==4)s1=s;    
 
}
 
int s2=0;
 
for(s=s1+1;s<datanumber+1;s++){   
int h=0;
if(s2==0)h=h+1;
if(data[s].indexOf("mw-headline")>-1)h=h+1;
if(data[s].indexOf("h2")>-1)h=h+1; 
if(h==3)s2=s;
 
}
 
String str="";
for(s=s1+1;s<s2;s++){   
if(s1>0)str=str+data[s];
    }
 
String[] x=str.split("</li>");
 
 
for(s=0;s<x.length-1;s++){
int p1=x[s].indexOf("/wiki/");
int p2=-1;
if(p1>-1)p2=x[s].indexOf(">",p1);
p2=x[s].indexOf(">",p1);
int p3=x[s].indexOf("</a>",p2);
int p4=x[s].indexOf("\"",p1);
String z="";
if(p1>-1)z=x[s].substring(p2+1,p3);
String z1="";
if(p1>-1)z1="https://ja.wikipedia.org"+x[s].substring(p1,p4);
if(z.length()>0)sx=sx+1; 
if(z.length()>0)name[sx]=z;    
if(z.length()>0)wiki[sx]=z1;  
if(z.length()>0)title[sx]=t;    
if(z.length()>0)code[sx]=cc;    
}
 
 
 
 
 
        }
 
 
        number=sx;
 
writexml("data.csv");
 
 
    }
 
 
    void writexml(String file){ 
 
    int s,sx;
 
try{ 
PrintWriter pw = new PrintWriter (new BufferedWriter(new FileWriter(file))); 
 
for(s=1;s<number+1;s++){  
pw.println(title[s]+","+code[s]+","+name[s]+","+wiki[s]);   
}
 
 
System.out.println("ファイルに書きこみました。"); 
pw.close(); 
} catch(IOException ep){ System.out.println("入出力エラーです。"); } 
 
 
}    
 
 
 
 
}
 
最終更新:2017年05月29日 10:36