Das Gelbe Forum Forum nach Zeit sortieren Forum nach letzter Antwort sortieren die 150 neuesten Beiträge
  • >Neu hier? / Infos
    • Leitlinien und Regeln
    • Das Gelbe Forum unterstützen
    • Hinweise zur Handhabung
    • Registrieren
    • Passwort vergessen?
    • Gefälschte E-Mails
    • Leserzuschriften
    • Abkürzungen
    • Impressum/Kontakt
    • Disclaimer
  • >Wissen
    • Einstiegsliteratur Debitismus
    • Weitere Literatur
    • Sammlungen
    • Buchempfehlungen
    • Altes Elliott-Wellen-Forum
  • >Elliott-Wellen
    • Elliott-Grundkurs
    • Alle ELLI-Beiträge
    • Elliott-Links
    • Elliott-Tagung 1
    • Elliott-Tagung 2
    • Altes Elliott-Wellen-Forum
    • Elliott-Tagung 1
    • Elliott-Tagung 2
  • >Themen
    • Risiken der Atomkraft
    • Buchempfehlungen
    • div. alternative Nachrichtenüberblicke
    • Froschgrafik
    • Chart du Jour
    • Das oekonomische Zitat
    • Beliebte Rechtschreibfehler
  • >Charts / Börsenlinks
    • Charts / Börsenlinks
    • Währungen
    • Rohstoffe
    • Aktienindizes
    • Gold in Euro
    • Silber in Euro
  • >Forumsarchive
    • Das alte Elliott-Wellen-Forum (2000-2007)
    • Das Gelbe Forum (2007-2017)
  
 
  • Login
zurück zur Hauptseite
  • in Thread öffnen

ARCHIV1 - HIER FINDET SICH DER ZEITRAUM BIS 2017

Forum-Menü | Fluchtburg autark am Meer | Goldpreis heute | Zum Tode von Jürgen Küßner | Bücher vom Kopp-Verlag
ZITAT »Wir ersticken in der Datenflut.«
Unterstützen Sie das Gelbe Forum durch Käufe bei Amazon. | Weitere Buch-Empfehlungen und Amazon-Navigation

Sourcen

Onkel S. @, Dienstag, 23.05.2017, 10:28 (vor 3253 Tagen) @ CalBaer

Hallo CalBaer,

hier mein Quick und Dirty Hack. Habe noch nix mit Github gemacht, deshalb habe ich mal die Sourcen gezippt und als ein File hochgeladen.

https://github.com/onkels/dasgelbeforum-kopierer/blob/master/sources.zip

Ich hoffe ich habe Euch jetzt nicht zuviel versprochen.

Das Programm erzeugt in einem zu definierenden Zielverzeichnis Unterordner für jeweils 1000 Posts. Der Name des Ordners ist Beitragsnummer geteilt durch 1000. Hier im Beispiel mein aktueller Import, der bei den Beiträgen 431000-431999 läuft. Dadurch kann ich jeden Unterordner wegzippen, sobald 1000 Beiträge geladen sind.


[image]

Jeder Ordner enthält neben den 1000 Dateien für die 1000 Beiträge (manchmal weniger, wenn vom Cheffe gelöscht wurde :-) auch einen Unterordner img, dort liegen die Bilder drin, welche in den 1000 Beiträgen referenziert sind. Es werden nicht alle Bilder geladen, war aber zu faul den Fehler zu suchen.

[image]

Aus den URLs der Bilder habe ich alle Sonderzeichen wie . / : & ? rausgeworfen, d.h. man kann am Name der Bilder noch erahnen, von wo ich die geladen habe.

[image]

Hier mal ein wahllos lokal geöffneter Beitrag. Man kann ihn lesen, und die Naviagtion unten zu den anderen Beiträgen funktioniert über relative links zu den anderen lokal gespeicherten Beiträgen.

[image]

Ein Problem habe ich nur mit ganz aktuellen Beiträgen, oder wenn bei alten Strängen neue Beiträge hinzukommen, dann aktualisiere ich nicht die Navigation bei den alten Beiträgen. Das könnte man aber offline neu berechnen.

Wichtig war mir nur, dass ich den Text der Beiträge und auch so viele Bilder wie möglich rette.

In dem ZIP liegen die Sourcen fürs Laden vom DGF als auch zum Laden des alten EWF-Archivs.

Ich werde den Content vom DGF aber nicht auf Github hochladen, da mir die Copyright-Situation unklar ist.

Die Klasse zum Laden ist

internetkopierer.dgf.LadeAktuelleBeitraege

Als Parameter das Zielverzeichnis mitgeben

Und die Pfade in den log4j.properties anpassen.

Wie gesagt, ist alles Quick und Dirty gehackt, funktioniert bei mir, bin aber zu faul das jetzt ordentlich zu machen.

Grüße,
S.

--
Keine Anlageempfehlung!
Keine Anlageberatung!
Keine Gewähr!
Umsetzung auf eigene Gefahr!

antworten
 

gesamter Thread:

 RSS-Feed dieser Diskussion

  • halb OT: zum Fortbestand des Gelben - HTTrack Website Copier ist keine Alternative, auch nicht als Archiv! - Griba, 22.05.2017, 11:58 [*]
    • Teilweise zu sichern mittels pdf... - Reffke, 22.05.2017, 12:46
    • Link umschreiben - printf, 22.05.2017, 15:00
      • wget kann links automatisch ändern - Rainer, 22.05.2017, 22:44
        • Hatte ich vor ein paar Tagen versucht, klappte aber nicht. Bitte um weitere(n)Tip(s). - neptun, 22.05.2017, 23:19
    • Ich habe eine lokal "browsebare" Kopie vom Gelben, inklusive der Bilder - Onkel S., 22.05.2017, 23:31
      • Habe Interesse. Inkl. Sammlung? - stokk, 22.05.2017, 23:43
      • Ebenfalls Interesse - neptun, 23.05.2017, 00:03
      • Kannst Du das Archiv auf github hochladen? (oT) [ [ kein Text ] ] - CalBaer, 23.05.2017, 00:30
        • Super Idee! (oT) - mabraton, 23.05.2017, 08:59
        • Sourcen - Onkel S., 23.05.2017, 10:28
          • Klasse, Besten Dank! (oT) [ [ kein Text ] ] - CalBaer, 23.05.2017, 17:57
    • Einzelne Benutzer sichern mit HTTrack - Rybezahl, 24.05.2017, 15:14
      • Wichtiger Hinweis - Rybezahl, 28.05.2017, 10:18
    • Wieso nicht einfach die DB verfügbar machen? - tar, 28.05.2017, 12:10

Werbung

Wandere aus, solange es noch geht.

CoinInvest -- Ihr Edelmetallhändler






444324 Einträge in 53482 Threads, 990 registrierte Benutzer, 56 Benutzer online (0 registrierte, 56 Gäste) | Forumszeit: 19.04.2026, 10:06 (Europe/Berlin)
Das Gelbe Forum: Das Forum für Elliott-Wellen, Börse, Wirtschaft, Debitismus, Geld, Zins, Staat, Macht (und natürlich auch Politik ud  Gesellschaft - und ein wenig alles andere) || Altes Elliott-Wellen-Forum

Ja, auch diese Webseite verwendet Cookies. Hier erfahren Sie alles zum Datenschutz
✖