Herzlich Willkommen, lieber Gast!
  Sie befinden sich hier:

  Forum » Java » HTML Datei herunterladen

Forum | Hilfe | Team | Links | Impressum | > Suche < | Mitglieder | Registrieren | Einloggen
  Quicklinks: MSDN-Online || STL || clib Reference Grundlagen || Literatur || E-Books || Zubehör || > F.A.Q. < || Downloads   

Autor Thread - Seiten: > 1 <
000
06.09.2006, 14:00 Uhr
J-jayz-Z
Perl Crack ala Carte
(Operator)


Da es anscheinend ein paar Leute gibt, die sich weigern eine Java FAQ einzurichten, poste ich es mal hier
Kleines Snippet, wie man eine HTML Datei runterladen kann mit Java. Hab ich ewig gesucht und ist find ich schlecht dokumentiert ....
Deshalb der Code hier:


C++:
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.Reader;
import java.net.URL;

import sun.net.www.protocol.http.HttpURLConnection;

class HtmlWork
{
    private String content = null;
    private URL url = null;
    private HttpURLConnection connection = null;
    private InputStream stream = null;
    private Reader reader = null;
    private BufferedReader bufReader = null;
    
    HtmlWork(String url) throws IOException
    {
        this.url = new URL(url);
        this.connection = (HttpURLConnection)this.url.openConnection();
        this.stream = this.connection.getInputStream();
        this.reader = new InputStreamReader(this.stream, "ISO8859_1");
        this.bufReader = new BufferedReader(this.reader);
        String line = new String();
        StringBuffer tmpContent = new StringBuffer();
        
        while((line = this.bufReader.readLine()) != null)
        {
            line = line.trim();
            tmpContent.append(line.trim()+"\n");
        }
        this.bufReader.close();
        this.content = tmpContent.toString();
    }
    
    public String getContent()
    {
        return this.content;
    }
    
    public static void main(String[] args)
    {
        try
        {
            HtmlWork work = new HtmlWork("http://www.fun-soft.de/index.php");
            System.out.println(work.getContent());
        }
        catch (IOException e)
        {
            e.printStackTrace();
        }
    }
}

--
perl -Mstrict -Mwarnings -e 'package blub; sub new { bless {} } sub bar {my $self=shift; $self->{bla}="66756e2d736f66742e6465"; return $self->{bla};} my $foo=blub->new();print "Hallo ";print pack("H*",$foo->bar()); print "\n"'
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
001
08.09.2006, 10:55 Uhr
Pler
Einer von Vielen
(Operator)


Ich hab das auch schon mal so ungefähr benutzt.
Diese Zeile:

Code:
this.reader = new InputStreamReader(this.stream, "ISO8859_1");

gefällt mir nicht. Das müsste man irgendwie vorher auslesen. Sonst passiert einfach zuoft mist.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
002
08.09.2006, 12:30 Uhr
Blubber2063



Wollte hier auch noch was zu schreiben, aus Erfahrung das Ding ist n Wrapper für Http soweit ich mich nicht falsch erinnere. Damit ist die Zeile schon evil, die mit dem Bufferreader ist dein Ende wenn du andere als Textdaten korrekt lesen willst. Würde empfehlen hier auch den Contenttype vorher zu überprüfen.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
Seiten: > 1 <     [ Java ]  


ThWBoard 2.73 FloSoft-Edition
© by Paul Baecher & Felix Gonschorek (www.thwboard.de)

Anpassungen des Forums
© by Flo-Soft (www.flo-soft.de)

Sie sind Besucher: