W myśl początku ostatniego wpisu na temat programu Beniamin w którym napomknąłem o produkcie G2P, postanowiłem owy temat rozszerzyć. Nie jest to temat na cały elaborat, ale krótkie i zwięzłe wyjaśnienie zasad działania, które pozwolą nam dowolnie modyfikować zapytanie do własnych celów. Otóż:
Zasada działania skryptu G2P jest bardzo prosta. Wyszukuję on listingi katalogów zawierających dane wyrażenie – w zależności od naszego wyboru: tytułu e-booka lub nazwy zespołu / utworu. Zapytanie kierowane do Google jest bardzo proste, a jak pisze sam autor: “Napisane po to, żebym nie musiał wklepywać go w wyszukiwarke za każdym razem.” Treść zapytania przy poszukiwaniu muzyki Mozarta wyglada tak:
intitle:index.of "mp3" +"Mozart" -htm -html -php -asp "Last Modified"
. Skrypt zwraca wszystkie strony generowane automatycznie przez serwer – bez *.html, *.php i innych które wymienimy po minusie. Samo index.of
i Last modified
również wskazuje na poszukiwanie takich listingów.
Zapytanie dotyczące wynajdowania w sieci e-booków jest juz nieco bardziej zaawansowane:
-inurl:htm -inurl:html intitle:"index of" +("/ebooks"|"/book") +(chm|pdf|zip) +"for dummies" "Last Modified"
A to przez to, że musimy skłonić wyszukiwarkę do odnalezienia stron zawierających rozszerzenia plików wielu typów: w tym przypadku to zarówno *.chm
jak *.pdf
i *.zip
. Rzecz jasna strony które są odnajdywane przez skrypt nie zawsze są tymi których poszukujemy, ale mając do dyspozycji treść zapytań – możemy je sami w dowolny sposób modyfikować.
W związku z powyższym: Enjoy!
1 comment