
Odstraneni diakritiky
no napada me upravy->nahradit -> vsechny pismena s diakritikou po jednom nahradit jejich verzi bez diakritiky... (ř - r nahradit vse, š -s nahradit vse...) jinak treba v C by to byl programek na par radku, jen si k tomu senout...
[QUOTE=mech13]no napada me upravy->nahradit -> vsechny pismena s diakritikou po jednom nahradit jejich verzi bez diakritiky... (ř - r nahradit vse, š -s nahradit vse...) jinak treba v C by to byl programek na par radku, jen si k tomu senout...[/QUOTE]
A není jednodušší použít už hotový prográmek/knihovnu iconv?
iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii
A není jednodušší použít už hotový prográmek/knihovnu iconv?
iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii
[QUOTE=mech13]no napada me upravy->nahradit -> vsechny pismena s diakritikou po jednom nahradit jejich verzi bez diakritiky... (ř - r nahradit vse, š -s nahradit vse...) jinak treba v C by to byl programek na par radku, jen si k tomu senout...[/QUOTE]
To me taky napadlo, ja ale myslel jestli to nejde nejak jednodusejc.
[QUOTE=Ritchie83]A není jednodušší použít už hotový prográmek/knihovnu iconv?
iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]
Co to je, kde to stahnu, jak se to pouziva???
To me taky napadlo, ja ale myslel jestli to nejde nejak jednodusejc.
[QUOTE=Ritchie83]A není jednodušší použít už hotový prográmek/knihovnu iconv?
iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]
Co to je, kde to stahnu, jak se to pouziva???
[QUOTE=Ritchie83]A není jednodušší použít už hotový prográmek/knihovnu iconv?
iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]
neni, protoze toto tema je v kategorii Operační systémy Windows
Zeli: je to prikaz z linuxu, takze jestli mas nekde po ruce nainstalovanyho linucha, hura do toho
iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]
neni, protoze toto tema je v kategorii Operační systémy Windows
Zeli: je to prikaz z linuxu, takze jestli mas nekde po ruce nainstalovanyho linucha, hura do toho
Bohuzel sem woknař a ne linuxák...
Prozatim sem to udelal jak psal mech13, kdyz ale nekdo prijdete na neco lepsiho, tak se branit nebudu.
Prozatim sem to udelal jak psal mech13, kdyz ale nekdo prijdete na neco lepsiho, tak se branit nebudu.
tak jsem neco zbastlil, snad to nahodim do prilohy...
program diakritika.exe
ve stejnym adresari ze souboru in.txt prevede text do souboru out.txt - oba musi existovat, out.txt si to samo nevytvori
delal jsem to podle "Příliš žluťoučký kůň úpěl ďábelské ódy", snad tam jsou vsechny znaky, jinak to vypise -cislo- -ASCII hodnota toho znaku, je potreba ju prihodit do zdrojaku a znova prelozit
edit:
nebyl by problem treba jmeno soubou v paramentru nebo ho treba zadat rucne po spusteni, ale ted se jdu ucit na zitrejsi zkousku, v pripade zajmu to nejak predelam ale az zitra
btw: zdrojak 20 radku + 1 radek na jeden znak...
program diakritika.exe
ve stejnym adresari ze souboru in.txt prevede text do souboru out.txt - oba musi existovat, out.txt si to samo nevytvori
delal jsem to podle "Příliš žluťoučký kůň úpěl ďábelské ódy", snad tam jsou vsechny znaky, jinak to vypise -cislo- -ASCII hodnota toho znaku, je potreba ju prihodit do zdrojaku a znova prelozit
edit:
nebyl by problem treba jmeno soubou v paramentru nebo ho treba zadat rucne po spusteni, ale ted se jdu ucit na zitrejsi zkousku, v pripade zajmu to nejak predelam ale az zitra
btw: zdrojak 20 radku + 1 radek na jeden znak...
[QUOTE=mech13]neni, protoze toto tema je v kategorii Operační systémy Windows
Zeli: je to prikaz z linuxu, takze jestli mas nekde po ruce nainstalovanyho linucha, hura do toho[/QUOTE]
Hluboce se mýlíte. Příkaz iconv je součást POSIX specifikace, takže jej naleznete na všech POSIX kompatibilních systémech, nejen v Linuxu. Dokonce i ve Windows jej lze používat, neboť je obsažen v balíku cygwin.
Zeli: je to prikaz z linuxu, takze jestli mas nekde po ruce nainstalovanyho linucha, hura do toho[/QUOTE]
Hluboce se mýlíte. Příkaz iconv je součást POSIX specifikace, takže jej naleznete na všech POSIX kompatibilních systémech, nejen v Linuxu. Dokonce i ve Windows jej lze používat, neboť je obsažen v balíku cygwin.
[QUOTE=Ritchie83]Hluboce se mýlíte. Příkaz iconv je součást POSIX specifikace, takže jej naleznete na všech POSIX kompatibilních systémech, nejen v Linuxu. Dokonce i ve Windows jej lze používat, neboť je obsažen v balíku cygwin.[/QUOTE]
neni to soucast ciste instalace win, nebo nektere bezne pouzivane aplikace. cygwin je potreba do win dodatecne nahodit, a jak je uvedeno na titulni strance prvni veta: "Cygwin is a Linux-like environment for Windows" - neni to nativni win nastroj
na windows lze pouzivat hodne veci, ale je potreba je tam dodat. to muzu rict, ze ve win muzu pouzivat vsechno, treba tak, ze to pridam instalaci linuchu na VMware:D
mnohem vic mu ale asi slo o nejakou funkci MS Office nez instalaci GNU software
neni to soucast ciste instalace win, nebo nektere bezne pouzivane aplikace. cygwin je potreba do win dodatecne nahodit, a jak je uvedeno na titulni strance prvni veta: "Cygwin is a Linux-like environment for Windows" - neni to nativni win nastroj
na windows lze pouzivat hodne veci, ale je potreba je tam dodat. to muzu rict, ze ve win muzu pouzivat vsechno, treba tak, ze to pridam instalaci linuchu na VMware:D
mnohem vic mu ale asi slo o nejakou funkci MS Office nez instalaci GNU software
[QUOTE=mech13]neni to soucast ciste instalace win, nebo nektere bezne pouzivane aplikace. cygwin je potreba do win dodatecne nahodit, a jak je uvedeno na titulni strance prvni veta: "Cygwin is a Linux-like environment for Windows" - neni to nativni win nastroj
na windows lze pouzivat hodne veci, ale je potreba je tam dodat. to muzu rict, ze ve win muzu pouzivat vsechno, treba tak, ze to pridam instalaci linuchu na VMware:D
mnohem vic mu ale asi slo o nejakou funkci MS Office nez instalaci GNU software[/QUOTE]
Přijde mi trochu zbytečné vytvářet další nedokonalý nástroj, když už existuje promyšlené funkční řešení. Tazateli proto doporučím používat příkaz iconv, který si nainstaluje jako součást cygwin spolu s dalšími mocnými nástroji. Příklad použití jsem ukázal ve svém předchozím příspěvku.
I když je to z pohledu tazatele OT, neodpustím si poznámku k cygwin. Jedná se o sadu souborů typu portable executable (tedy nativního formátu binárek ve Windows), která poskytuje POSIX prostředí. Nevím, co si představujete pod pojmem nativní, ale iconv.exe je z pohledu Windows stejně nativní jako kupříkladu vaše binárka diakritika.exe. Mimochodem, když už hovoříme o GNU, proč se ve vaší binárce diakritika.exe objevují identifikátory jako MINGW32 či gccmain.c? ;-)
na windows lze pouzivat hodne veci, ale je potreba je tam dodat. to muzu rict, ze ve win muzu pouzivat vsechno, treba tak, ze to pridam instalaci linuchu na VMware:D
mnohem vic mu ale asi slo o nejakou funkci MS Office nez instalaci GNU software[/QUOTE]
Přijde mi trochu zbytečné vytvářet další nedokonalý nástroj, když už existuje promyšlené funkční řešení. Tazateli proto doporučím používat příkaz iconv, který si nainstaluje jako součást cygwin spolu s dalšími mocnými nástroji. Příklad použití jsem ukázal ve svém předchozím příspěvku.
I když je to z pohledu tazatele OT, neodpustím si poznámku k cygwin. Jedná se o sadu souborů typu portable executable (tedy nativního formátu binárek ve Windows), která poskytuje POSIX prostředí. Nevím, co si představujete pod pojmem nativní, ale iconv.exe je z pohledu Windows stejně nativní jako kupříkladu vaše binárka diakritika.exe. Mimochodem, když už hovoříme o GNU, proč se ve vaší binárce diakritika.exe objevují identifikátory jako MINGW32 či gccmain.c? ;-)
[QUOTE=Ritchie83]Přijde mi trochu zbytečné vytvářet další nedokonalý nástroj, když už existuje promyšlené funkční řešení. Tazateli proto doporučím používat příkaz iconv, který si nainstaluje jako součást cygwin spolu s dalšími mocnými nástroji. Příklad použití jsem ukázal ve svém předchozím příspěvku.
I když je to z pohledu tazatele OT, neodpustím si poznámku k cygwin. Jedná se o sadu souborů typu portable executable (tedy nativního formátu binárek ve Windows), která poskytuje POSIX prostředí. Nevím, co si představujete pod pojmem nativní, ale iconv.exe je z pohledu Windows stejně nativní jako kupříkladu vaše binárka diakritika.exe. Mimochodem, když už hovoříme o GNU, proč se ve vaší binárce diakritika.exe objevují identifikátory jako MINGW32 či gccmain.c? ;-)[/QUOTE]
[OT]tim nativnim jsem myslel, ze pochazi z linuxu (prave hned ta uvodni veta s "Linux-like environment") a neni to defaultni win nastroj, nic vic, nic min. moje reseni je o to nativnejsi, ze jsem ho psal v notepadu:D
tucnakovi se musi nechat, ze programovani pod nim je prirozenejsi a delat programy ve win je jen snaha o linux-like prostredi (kdyz nepocitam vetsi vyvojova prostredi - netbeans, visual studio...)[/OT]
I když je to z pohledu tazatele OT, neodpustím si poznámku k cygwin. Jedná se o sadu souborů typu portable executable (tedy nativního formátu binárek ve Windows), která poskytuje POSIX prostředí. Nevím, co si představujete pod pojmem nativní, ale iconv.exe je z pohledu Windows stejně nativní jako kupříkladu vaše binárka diakritika.exe. Mimochodem, když už hovoříme o GNU, proč se ve vaší binárce diakritika.exe objevují identifikátory jako MINGW32 či gccmain.c? ;-)[/QUOTE]
[OT]tim nativnim jsem myslel, ze pochazi z linuxu (prave hned ta uvodni veta s "Linux-like environment") a neni to defaultni win nastroj, nic vic, nic min. moje reseni je o to nativnejsi, ze jsem ho psal v notepadu:D
tucnakovi se musi nechat, ze programovani pod nim je prirozenejsi a delat programy ve win je jen snaha o linux-like prostredi (kdyz nepocitam vetsi vyvojova prostredi - netbeans, visual studio...)[/OT]
Pokud se jednalo jen o Excel a Word, tak to slo resit rychle makrem...obsahovalo by zhruba to, co psal mech13 jako prvni prispevek.
[QUOTE=Ritchie83]A není jednodušší použít už hotový prográmek/knihovnu iconv?
iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]
Nechci se hádat, ale on iconv umí formáty Wordu a Excelu, jak se ptal původní tazatel?
iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]
Nechci se hádat, ale on iconv umí formáty Wordu a Excelu, jak se ptal původní tazatel?
[QUOTE=Lax]Nechci se hádat, ale on iconv umí formáty Wordu a Excelu, jak se ptal původní tazatel?[/QUOTE]
Tazatel datový formát bohužel nikterak nespecifikoval, psal pouze o programech jako Word a Excel nebo nějakých podobných, z čehož jsem datový formát skutečně nevyrozuměl. K datovým formátům, se kterými umí Word či Excel pracovat a které iconv dokáže bezproblémově transformovat, patří např. txt či csv. Pravděpodobně by po rozzipování šly transformovat i formáty docx a xlsx.
Tazatel datový formát bohužel nikterak nespecifikoval, psal pouze o programech jako Word a Excel nebo nějakých podobných, z čehož jsem datový formát skutečně nevyrozuměl. K datovým formátům, se kterými umí Word či Excel pracovat a které iconv dokáže bezproblémově transformovat, patří např. txt či csv. Pravděpodobně by po rozzipování šly transformovat i formáty docx a xlsx.
[QUOTE=mech13]tak jsem neco zbastlil, snad to nahodim do prilohy...
program diakritika.exe
ve stejnym adresari ze souboru in.txt prevede text do souboru out.txt - oba musi existovat, out.txt si to samo nevytvori
delal jsem to podle "Příliš žluťoučký kůň úpěl ďábelské ódy", snad tam jsou vsechny znaky, jinak to vypise -cislo- -ASCII hodnota toho znaku, je potreba ju prihodit do zdrojaku a znova prelozit
edit:
nebyl by problem treba jmeno soubou v paramentru nebo ho treba zadat rucne po spusteni, ale ted se jdu ucit na zitrejsi zkousku, v pripade zajmu to nejak predelam ale az zitra
btw: zdrojak 20 radku + 1 radek na jeden znak...[/QUOTE]
Funguje to pekne, jen si to neporadi s velkymi pismeny s hacky a carkami. Jestli s tim neco udelas a soupnes to sem ke stahnuti, tak to bude good. :thumb
A dík ;) :thumb
program diakritika.exe
ve stejnym adresari ze souboru in.txt prevede text do souboru out.txt - oba musi existovat, out.txt si to samo nevytvori
delal jsem to podle "Příliš žluťoučký kůň úpěl ďábelské ódy", snad tam jsou vsechny znaky, jinak to vypise -cislo- -ASCII hodnota toho znaku, je potreba ju prihodit do zdrojaku a znova prelozit
edit:
nebyl by problem treba jmeno soubou v paramentru nebo ho treba zadat rucne po spusteni, ale ted se jdu ucit na zitrejsi zkousku, v pripade zajmu to nejak predelam ale az zitra
btw: zdrojak 20 radku + 1 radek na jeden znak...[/QUOTE]
Funguje to pekne, jen si to neporadi s velkymi pismeny s hacky a carkami. Jestli s tim neco udelas a soupnes to sem ke stahnuti, tak to bude good. :thumb
A dík ;) :thumb
no bylo to jenom takovy narychlo, jenom podle toho zlutyho kone. mrknu i na velky...
jeste dnes by to mohlo byt, nejpozdej zitra (jako dnes po pulnoci)
//tak tady to je
////taky vam to u .rar neukazuje nikomu ikonu?:notsure
//////je to teda delany pro default notepad kodovani, byt to v cemkoli jinym tak to asi zatrepe nohama a nahaze spoustu nesmyslu...
jeste dnes by to mohlo byt, nejpozdej zitra (jako dnes po pulnoci)
//tak tady to je
////taky vam to u .rar neukazuje nikomu ikonu?:notsure
//////je to teda delany pro default notepad kodovani, byt to v cemkoli jinym tak to asi zatrepe nohama a nahaze spoustu nesmyslu...
[QUOTE=mech13]no bylo to jenom takovy narychlo, jenom podle toho zlutyho kone. mrknu i na velky...
jeste dnes by to mohlo byt, nejpozdej zitra (jako dnes po pulnoci)
//tak tady to je
////taky vam to u .rar neukazuje nikomu ikonu?:notsure
//////je to teda delany pro default notepad kodovani, byt to v cemkoli jinym tak to asi zatrepe nohama a nahaze spoustu nesmyslu...[/QUOTE]
V tomhle uz sem na zadnou chybku nenarazil(treba narazi nekdo jinej :)).
Tak jeste jednou dik :thumb.
jeste dnes by to mohlo byt, nejpozdej zitra (jako dnes po pulnoci)
//tak tady to je
////taky vam to u .rar neukazuje nikomu ikonu?:notsure
//////je to teda delany pro default notepad kodovani, byt to v cemkoli jinym tak to asi zatrepe nohama a nahaze spoustu nesmyslu...[/QUOTE]
V tomhle uz sem na zadnou chybku nenarazil(treba narazi nekdo jinej :)).
Tak jeste jednou dik :thumb.