reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Odstraneni diakritiky

Zeli (397)|23.5.2007 18:12
Lze ve Wordu, Excelu nebo necem podobnym odstranit z textu hacky a carky?
mech13 (5526)|23.5.2007 18:22
no napada me upravy->nahradit -> vsechny pismena s diakritikou po jednom nahradit jejich verzi bez diakritiky... (ř - r nahradit vse, š -s nahradit vse...) jinak treba v C by to byl programek na par radku, jen si k tomu senout...
Ritchie83 (369)|23.5.2007 19:20
[QUOTE=mech13]no napada me upravy->nahradit -> vsechny pismena s diakritikou po jednom nahradit jejich verzi bez diakritiky... (ř - r nahradit vse, š -s nahradit vse...) jinak treba v C by to byl programek na par radku, jen si k tomu senout...[/QUOTE]
A není jednodušší použít už hotový prográmek/knihovnu iconv?

iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii
Zeli (397)|23.5.2007 19:34
[QUOTE=mech13]no napada me upravy->nahradit -> vsechny pismena s diakritikou po jednom nahradit jejich verzi bez diakritiky... (ř - r nahradit vse, š -s nahradit vse...) jinak treba v C by to byl programek na par radku, jen si k tomu senout...[/QUOTE]
To me taky napadlo, ja ale myslel jestli to nejde nejak jednodusejc.

[QUOTE=Ritchie83]A není jednodušší použít už hotový prográmek/knihovnu iconv?

iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]
Co to je, kde to stahnu, jak se to pouziva???
mech13 (5526)|23.5.2007 19:51
[QUOTE=Ritchie83]A není jednodušší použít už hotový prográmek/knihovnu iconv?

iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]
neni, protoze toto tema je v kategorii Operační systémy Windows

Zeli: je to prikaz z linuxu, takze jestli mas nekde po ruce nainstalovanyho linucha, hura do toho
Zeli (397)|23.5.2007 20:44
Bohuzel sem woknař a ne linuxák...
Prozatim sem to udelal jak psal mech13, kdyz ale nekdo prijdete na neco lepsiho, tak se branit nebudu.
mech13 (5526)|23.5.2007 21:17
tak jsem neco zbastlil, snad to nahodim do prilohy...

program diakritika.exe
ve stejnym adresari ze souboru in.txt prevede text do souboru out.txt - oba musi existovat, out.txt si to samo nevytvori

delal jsem to podle "Příliš žluťoučký kůň úpěl ďábelské ódy", snad tam jsou vsechny znaky, jinak to vypise -cislo- -ASCII hodnota toho znaku, je potreba ju prihodit do zdrojaku a znova prelozit


edit:
nebyl by problem treba jmeno soubou v paramentru nebo ho treba zadat rucne po spusteni, ale ted se jdu ucit na zitrejsi zkousku, v pripade zajmu to nejak predelam ale az zitra

btw: zdrojak 20 radku + 1 radek na jeden znak...
Ritchie83 (369)|23.5.2007 22:13
[QUOTE=mech13]neni, protoze toto tema je v kategorii Operační systémy Windows

Zeli: je to prikaz z linuxu, takze jestli mas nekde po ruce nainstalovanyho linucha, hura do toho[/QUOTE]
Hluboce se mýlíte. Příkaz iconv je součást POSIX specifikace, takže jej naleznete na všech POSIX kompatibilních systémech, nejen v Linuxu. Dokonce i ve Windows jej lze používat, neboť je obsažen v balíku cygwin.
mech13 (5526)|23.5.2007 22:25
[QUOTE=Ritchie83]Hluboce se mýlíte. Příkaz iconv je součást POSIX specifikace, takže jej naleznete na všech POSIX kompatibilních systémech, nejen v Linuxu. Dokonce i ve Windows jej lze používat, neboť je obsažen v balíku cygwin.[/QUOTE]
neni to soucast ciste instalace win, nebo nektere bezne pouzivane aplikace. cygwin je potreba do win dodatecne nahodit, a jak je uvedeno na titulni strance prvni veta: "Cygwin is a Linux-like environment for Windows" - neni to nativni win nastroj
na windows lze pouzivat hodne veci, ale je potreba je tam dodat. to muzu rict, ze ve win muzu pouzivat vsechno, treba tak, ze to pridam instalaci linuchu na VMware:D

mnohem vic mu ale asi slo o nejakou funkci MS Office nez instalaci GNU software
Ritchie83 (369)|23.5.2007 23:41
[QUOTE=mech13]neni to soucast ciste instalace win, nebo nektere bezne pouzivane aplikace. cygwin je potreba do win dodatecne nahodit, a jak je uvedeno na titulni strance prvni veta: "Cygwin is a Linux-like environment for Windows" - neni to nativni win nastroj
na windows lze pouzivat hodne veci, ale je potreba je tam dodat. to muzu rict, ze ve win muzu pouzivat vsechno, treba tak, ze to pridam instalaci linuchu na VMware:D

mnohem vic mu ale asi slo o nejakou funkci MS Office nez instalaci GNU software[/QUOTE]
Přijde mi trochu zbytečné vytvářet další nedokonalý nástroj, když už existuje promyšlené funkční řešení. Tazateli proto doporučím používat příkaz iconv, který si nainstaluje jako součást cygwin spolu s dalšími mocnými nástroji. Příklad použití jsem ukázal ve svém předchozím příspěvku.

I když je to z pohledu tazatele OT, neodpustím si poznámku k cygwin. Jedná se o sadu souborů typu portable executable (tedy nativního formátu binárek ve Windows), která poskytuje POSIX prostředí. Nevím, co si představujete pod pojmem nativní, ale iconv.exe je z pohledu Windows stejně nativní jako kupříkladu vaše binárka diakritika.exe. Mimochodem, když už hovoříme o GNU, proč se ve vaší binárce diakritika.exe objevují identifikátory jako MINGW32 či gccmain.c? ;-)
mech13 (5526)|23.5.2007 23:57
[QUOTE=Ritchie83]Přijde mi trochu zbytečné vytvářet další nedokonalý nástroj, když už existuje promyšlené funkční řešení. Tazateli proto doporučím používat příkaz iconv, který si nainstaluje jako součást cygwin spolu s dalšími mocnými nástroji. Příklad použití jsem ukázal ve svém předchozím příspěvku.

I když je to z pohledu tazatele OT, neodpustím si poznámku k cygwin. Jedná se o sadu souborů typu portable executable (tedy nativního formátu binárek ve Windows), která poskytuje POSIX prostředí. Nevím, co si představujete pod pojmem nativní, ale iconv.exe je z pohledu Windows stejně nativní jako kupříkladu vaše binárka diakritika.exe. Mimochodem, když už hovoříme o GNU, proč se ve vaší binárce diakritika.exe objevují identifikátory jako MINGW32 či gccmain.c? ;-)[/QUOTE]
[OT]tim nativnim jsem myslel, ze pochazi z linuxu (prave hned ta uvodni veta s "Linux-like environment") a neni to defaultni win nastroj, nic vic, nic min. moje reseni je o to nativnejsi, ze jsem ho psal v notepadu:D
tucnakovi se musi nechat, ze programovani pod nim je prirozenejsi a delat programy ve win je jen snaha o linux-like prostredi (kdyz nepocitam vetsi vyvojova prostredi - netbeans, visual studio...)[/OT]
tequilla (1015)|24.5.2007 09:33
Pokud se jednalo jen o Excel a Word, tak to slo resit rychle makrem...obsahovalo by zhruba to, co psal mech13 jako prvni prispevek.
Lax (97)|24.5.2007 14:36
[QUOTE=Ritchie83]A není jednodušší použít už hotový prográmek/knihovnu iconv?

iconv -f UTF-8 -t ASCII//TRANSLIT < soubor.txt.utf8 > soubor.txt.ascii[/QUOTE]

Nechci se hádat, ale on iconv umí formáty Wordu a Excelu, jak se ptal původní tazatel?
Ritchie83 (369)|24.5.2007 15:50
[QUOTE=Lax]Nechci se hádat, ale on iconv umí formáty Wordu a Excelu, jak se ptal původní tazatel?[/QUOTE]
Tazatel datový formát bohužel nikterak nespecifikoval, psal pouze o programech jako Word a Excel nebo nějakých podobných, z čehož jsem datový formát skutečně nevyrozuměl. K datovým formátům, se kterými umí Word či Excel pracovat a které iconv dokáže bezproblémově transformovat, patří např. txt či csv. Pravděpodobně by po rozzipování šly transformovat i formáty docx a xlsx.
Zeli (397)|24.5.2007 16:43
[QUOTE=mech13]tak jsem neco zbastlil, snad to nahodim do prilohy...

program diakritika.exe
ve stejnym adresari ze souboru in.txt prevede text do souboru out.txt - oba musi existovat, out.txt si to samo nevytvori

delal jsem to podle "Příliš žluťoučký kůň úpěl ďábelské ódy", snad tam jsou vsechny znaky, jinak to vypise -cislo- -ASCII hodnota toho znaku, je potreba ju prihodit do zdrojaku a znova prelozit


edit:
nebyl by problem treba jmeno soubou v paramentru nebo ho treba zadat rucne po spusteni, ale ted se jdu ucit na zitrejsi zkousku, v pripade zajmu to nejak predelam ale az zitra

btw: zdrojak 20 radku + 1 radek na jeden znak...[/QUOTE]

Funguje to pekne, jen si to neporadi s velkymi pismeny s hacky a carkami. Jestli s tim neco udelas a soupnes to sem ke stahnuti, tak to bude good. :thumb
A dík ;) :thumb
mech13 (5526)|24.5.2007 17:03
no bylo to jenom takovy narychlo, jenom podle toho zlutyho kone. mrknu i na velky...
jeste dnes by to mohlo byt, nejpozdej zitra (jako dnes po pulnoci)

//tak tady to je

////taky vam to u .rar neukazuje nikomu ikonu?:notsure

//////je to teda delany pro default notepad kodovani, byt to v cemkoli jinym tak to asi zatrepe nohama a nahaze spoustu nesmyslu...
P@pi (1519)|24.5.2007 17:23
OT: neukazuje, sprav o tom KP :p. Já zase mizim.
Zeli (397)|25.5.2007 05:18
[QUOTE=mech13]no bylo to jenom takovy narychlo, jenom podle toho zlutyho kone. mrknu i na velky...
jeste dnes by to mohlo byt, nejpozdej zitra (jako dnes po pulnoci)

//tak tady to je

////taky vam to u .rar neukazuje nikomu ikonu?:notsure

//////je to teda delany pro default notepad kodovani, byt to v cemkoli jinym tak to asi zatrepe nohama a nahaze spoustu nesmyslu...[/QUOTE]
V tomhle uz sem na zadnou chybku nenarazil(treba narazi nekdo jinej :)).
Tak jeste jednou dik :thumb.
Madagio (8)|25.5.2007 09:31
Odstranit diakritiku umi perfektne PSPAD, ale samozrejme v txt souborech, ne v .DOC