V minulém článku „Jak si (ne)nastavit heslo“ jsem se zmínil o slovníkovém útoku. Ovšem kde vzít kvalitní (komplexní ) – český slovník ( wordlist ) ?
Bádal jsem nad tímto problémem a přišlo mi vhodné použít již existující slovník. GNU Aspell. Z něj vypsat všechna slova a následně je vyfiltrovat, setřídit.
Vypsání veškerého slovníku aspell-cs jsem realizoval následujícím příkazem v linuxu
aspell -l cs dump master | aspell -l cs expand | tr ‚ ‚ ‚\n‘ > /cs.dic
Výsledný soubor ovšem neobsahuje slova bez diakritiky, proto tedy ještě bylo třeba odstranit diakritiku. Na to jsem použil program Diakritika 1.0 od Hematita. No a nakonec vše sloučit a setřídit. K tomu posoužil určitě známý Raptor v3
Tímto způsobem jsem zapracoval i na slovníku pro Slovenštinu. A takto by určitě šlo vytvořit spousty dalších slovníků. Takže ke stažení….
Komplexní český Wordlist / Complex Czech language wordlist – CZ.7z
Komplexní slovenský Wordlist / Complex Slovak language wordlist – SK.7z
Dobrý den,
Stáhl jsem si vámi vytvořený český wordlist, ale potřeboval bych radu jak mám daný soubor rozbalit. Příponu 7z vidím prvně. Děkuji za radu.
Program na práci s archivy 7z a nejen jimi ( ZIP, GZIP, BZIP2) najdete na http://www.7-zip.org/
Pepa, jak se tak na nej koukam, bude jiste hesla z wordlistu zadavat rucne 🙂 pokud to teda rozbalil…
Je sice hezké, že jste odstranil diakritiku a hesla abecedně seřadil, ale bohužel je ve slovníku pořád přes 3 miliony frází s diakritikou a abecedně je seřazen po úsecích – abeceda se opakuje několikrát.
Je možné získat wordlist z aspellu včetně češtiny?
Spusťe si příkaz viz výše – je to komplet s češtinou.
To mi právě nejde… jinak bych takhle neprosil. 🙂
Moc by mi to pomohlo…
Su tam aj ine „chybycky krasy“. Ked si dam napriklad heslo „karol“ „maria“ alebo „12345“ tak s tymto wordlistom nepochodim. Je to taka odflaknuta robota. Ale ten navod sa ceni. Skusim si nieco spravit sam. Ak to bude za nieco stat, tak sa urcite s Vami podelim. 🙂
Napisal som na tuto temu clanok, kde pojednavam o tom ako vytiahnut cely slovnik v txt formate z Aspell-u a tiez ako ho potom prekonvertovat do MySQL databazy. Je to tu: https://www.joe0.com/2018/02/13/how-to-dump-and-convert-aspell-dictionary-to-wordlist-or-searchable-mysql-mariadb-database/
Ja som tymto sposobom vytiahol zopar slovnikov pre: http://www.scrabbleslovnik.sk
Škoda, že už jsi to rovnou nedal i ke stažení.
Ne každý to potřebuje umět vytáhnout a stačí mu jen ten slovník.