Site programming by Marcin Junczys-Dowmunt



 
 
 

Marcin Junczys-Dowmunt - Narzędzia informatyczne w językoznawstwie

From Zakład Logiki Stosowanej

(Różnice między wersjami)
Wersja z dnia 13:56, 15 kwi 2009 (edytuj)
Junczys (Dyskusja | wkład)
d
← Poprzednia edycja
Wersja z dnia 13:35, 3 cze 2009 (edytuj) (undo)
Junczys (Dyskusja | wkład)
d
Następna edycja →
Linia 92: Linia 92:
* Strona do testowania wyrażeń regularnych [http://www.dhtmlgoodies.com/scripts/regular-expression/regular-expression.html] * Strona do testowania wyrażeń regularnych [http://www.dhtmlgoodies.com/scripts/regular-expression/regular-expression.html]
-===Perl - Wyrażenie regularne (16.01.2008)===+===Perl - Wyrażenie regularne (16.04.2008)===
* Prezentacja: [[ Media:Wyklad12.pdf | Perl - Wyrażenie regularne ]] [ pdf ] * Prezentacja: [[ Media:Wyklad12.pdf | Perl - Wyrażenie regularne ]] [ pdf ]
* Wersja do druku [[ Media:Wyklad12-handout.pdf | Perl - Wyrażenia regularne ]] [ pdf ] * Wersja do druku [[ Media:Wyklad12-handout.pdf | Perl - Wyrażenia regularne ]] [ pdf ]
Linia 101: Linia 101:
* Skrócony tutorial dotyczący wyrażeń regularnych w Perlu [http://perldoc.perl.org/perlrequick.html] * Skrócony tutorial dotyczący wyrażeń regularnych w Perlu [http://perldoc.perl.org/perlrequick.html]
* Pełny i dosyć zaawansowany tutorial dotyczący wyrażeń regularnych w Perlu [http://perldoc.perl.org/perlretut.html] * Pełny i dosyć zaawansowany tutorial dotyczący wyrażeń regularnych w Perlu [http://perldoc.perl.org/perlretut.html]
 +
 +
 +===Przetwarzania tekstów wielojęzycznych (03.06.2009)===
 +* Prezentacja: [[ Media:Wyklad17.pdf | Przetwarzanie tekstów wielojęzycznych ]] [ pdf ]
 +* Wersja do druku [[ Media:Wyklad17-handout.pdf | Przetwarzanie tekstów wielojęzycznych ]] [ pdf ]
 +* [[ Media: Zd_kodowanie.pdf | Zadania domowe - Przetwarzanie tekstów wielojęzycznych ]] [ pdf ]
 +
 +Przydatne linki:
 +* Wpis dot. '''ASCII''' na pl.wikipedia.org [http://pl.wikipedia.org/wiki/ASCII]
 +* Wpis dot. '''ISO-8859''' na pl.wikipedia.org [http://pl.wikipedia.org/wiki/ISO_8859]
 +* Wpis dot. '''ISO-8859-1''' na pl.wikipedia.org [http://pl.wikipedia.org/wiki/ISO_8859-1]
 +* Wpis dot. '''ISO-8859-2''' na pl.wikipedia.org [http://pl.wikipedia.org/wiki/ISO_8859-2]
 +* Wpis dot. '''CP-1252''' na pl.wikipedia.org [http://pl.wikipedia.org/wiki/Windows-1252]
 +* Wpis dot. '''CP-1250''' na pl.wikipedia.org [http://pl.wikipedia.org/wiki/Windows-1250]
 +* Wpis dot. '''Unicode''' na en.wikipedia.org [http://en.wikipedia.org/wiki/Unicode]
 +* Wpis dot. '''UTF-8''' na en.wikipedia.org [http://en.wikipedia.org/wiki/UTF-8]
 +* Strona domowa Unicode [http://www.unicode.org]
 +* Zestawy kodów i znaków Unicode [http://www.unicode.org/charts/]
 +
 +
 +<!--
 +===Przetwarzania tekstów wielojęzycznych - zajęcia praktyczne (09.04.2008)===
 +* [[ Media: materialy.zip | Materiały do zajęć ]] [ zip ]
 +* [[ Media: Zd_przetwarzanie.pdf | Zadania domowe - Przetwarzanie tekstów wielojęzycznych 2 ]] [ pdf ] -->
 +

Wersja z dnia 13:35, 3 cze 2009

Spis treści


Witam na stronie wykładu monograficznego "Narzędzia informatyczne w językoznawstwie"

Celem przedmiotu jest zaznajomienie słuchaczy z technologiami, standardami oraz narzędziami informatycznymi stosowanymi w językoznawstwie, szczególnie w takich dziedzinach jak leksykografia, lingwistyka korpusowa, lingwistyka komputerowa.

Będziemy między innymi omawiać i stosować metody: przetwarzania tekstów napisanych za pomocą różnych alfabetów, wyszukiwania informacji lingwistycznych w zbiorach tekstów oraz w internecie, generowania i przetwarzania anotacji lingwistycznych za pomocą standardu XML i wiele więcej. Będziemy korzystać z narzędzi i zasobów publicznie dostępnych w internecie oraz z uniwersalnego języka programowania Perl, który jest szczególnie przystosowany do przetwarzania tekstów w najróżniejszych postaciach.


Punktacja za zadania domowe


Semestr pierwszy

Dane lingwistyczne a komputer (08.10.2008)


Przydatne linki:

  • EmEditor Free [1] (zadanie domowe)
  • ActivePerl [2] (zadanie domowe)

Wiersz poleceń (1) - w wersji Microsoft Windows (15.10.2008)

Wiersz poleceń (2) - potoki i pliki wsadowe (22.10.2007)


Przydatne linki:

  • commandwindows.com [3]
  • Kurs Windows Shell Cay S. Horstmann'a (Wprowadzenie) [4]
  • Kurs Windows Shell Cay S. Horstmann'a (Zaawansowane) [5]
  • Oficjalna strona Microsoft o wierszu poleceń [6]

Perl - Wprowadzenie (29.10.2008)


Przydatne linki:

  • ActivePerl [7] (zadanie domowe)
  • Cygwin [8]
  • Pełna oficjalna dokumentacja Perla (perldoc) [9]
  • Krótkie wprowadzenie do Perla (perlintro) [10] - wersja pdf [11]
  • Często zadawane pytania (perlfaq) [12]
  • Learning Pearl, third Edition [13]

Perl - Zmienne skalarne i struktury kontrolne (05.11.2008)


Przydatne linki:

  • Learning Pearl, third Edition [14]

Perl - Zmienne skalarne i struktury kontrolne (12.11.2008)

Perl - Podstawowe operacje wejćia i wyjścia (19.11.2008)

Perl - Manipulacja tablic, zmienne lokalne, funkcje (24.12.2008)


Semestr drugi

Perl - Tablice asocjacyjne oraz funkcje tablicowe (25.02.2009)

Intermezzo - Wyrażenia regularne (01.04.2009)

Przydatne linki:

  • Ściąga dotycząca wyrażeń regularnych [15]
  • Strona do testowania wyrażeń regularnych [16]

Perl - Wyrażenie regularne (16.04.2008)


Przydatne linki:

  • Wszystkie poprzednie linki
  • Skrócony tutorial dotyczący wyrażeń regularnych w Perlu [17]
  • Pełny i dosyć zaawansowany tutorial dotyczący wyrażeń regularnych w Perlu [18]


Przetwarzania tekstów wielojęzycznych (03.06.2009)

Przydatne linki:

  • Wpis dot. ASCII na pl.wikipedia.org [19]
  • Wpis dot. ISO-8859 na pl.wikipedia.org [20]
  • Wpis dot. ISO-8859-1 na pl.wikipedia.org [21]
  • Wpis dot. ISO-8859-2 na pl.wikipedia.org [22]
  • Wpis dot. CP-1252 na pl.wikipedia.org [23]
  • Wpis dot. CP-1250 na pl.wikipedia.org [24]
  • Wpis dot. Unicode na en.wikipedia.org [25]
  • Wpis dot. UTF-8 na en.wikipedia.org [26]
  • Strona domowa Unicode [27]
  • Zestawy kodów i znaków Unicode [28]