Synchronizacja systemów bazodanowych uczelni

Tomasz Wolniewicz
UMK

Wstęp

Typową sytuacją polskich uczelni jest rozproszenie zarządzania różnymi elementami działalności w niezależnych systemach informatycznych. Do obszarów, które wymagają wspomagania komputerowego należą zazwyczaj:

  1. kadry,
  2. płace,
  3. obsługa internetowych kont pracowników,
  4. biblioteka,
  5. obsługa toku studiów,
  6. internetowy system informacyjny.

W systemach informatycznych wspierających te wszystkie obszary gromadzi się m. in. dane pracowników uczelni. Zarządzanie tymi danymi spoczywa na osobach administrujących poszczególnymi systemami, jest to nie tylko nieefektywne, ale również prowadzi do niespójności w danych, ponieważ administratorzy są rzadko informowani o zmianach. Na przykład mało który pracownik uczelni powiadomi bibliotekę główną o zmianie swojego stanowiska, czy przynalezności do jednostki organizacyjnej. W ramach projektu ... przeprowadzono analizę przepływów informacji miedzy takimi systemami, zaproponowano konkretne rozwiązania i zaimplementowano część oprogramowania dla konkretnego przykładu jakim jest Uniwersytet Mikołaja Kopernika w Toruniu. Prace prowadzone w ramach tego zadania pozostawały w ścisłym związku z przygotowaniem interfejsu do bazy LDAP, przygotowaniem bazy informacyjnoadresowej Uczelni oraz określeniem niezbędnego zestawu atrybutów dla klasy plEduPerson.

Baza LDAP okazuje się znakomitym, uniwersalnym narzędziem wymiany danych i rozwiązania wypracowane dla przypadku UMK mogą być zastosowane również w innych uczelniach.

Analiza sytuacji na UMK

Uniwersytet Mikołaja Kopernika skomputeryzował większość procesów związanych z zarządzaniem i informowaniem, ale automatyzacja różnych obszarów następowała w różnym czasie, przy pomocy niespójnych narzędzi i, często bez określana metod współpracy różnych systemów.

Jednym z zadań projektu LDAP było stworzenie bazy informacyjno-adresowej zarówno na potrzeby wewnętrzne jak i zewnętrzne. Taka baza mogłaby zastąpić drukowany periodycznie Skład Osobowy.

Dane pracowników uczelni pojawiają się w następujących, głównych systemach informatycznych:

  1. system kadrowo-płacowy (TETA Personel),
  2. system wspierający tworzenie Składu Osobowego (rozwiązania lokalne),
  3. systemy obsługujące konta internetowe pracowników (rozwiązania lokalne),
  4. system biblioteczny (Horizon),
  5. system obsługi toku studiów (rozwiązania własne i USOS),
  6. internetowy system informacyjny.

Do sprawnego funkcjonowania Uczelni niezbędne jest zapewnienie spójności tych wszystkich systemów informatycznych, z uwzględnieniem ich specyficznych cech, zabezpieczeń, praw dostępu do szczególnie newralgicznych obszarów informacji itp.

Projekt rozpoczęto od szczegółowej analizy możliwości i potrzeb systemów Uczelni oraz opisania kierunków przepływu informacji.

System kadrowo-płacowy TETA-Personel został zaprojektowany w sposób umożliwiający przechowywanie praktycznie pełnej informacji o pracowniku i w związku z tym potencjalnie mógłby być jedynym źródłem informacji zasilającym pozostałe systemy. W praktyce okazuje się jednak, że dane w tym systemie są często niepełne, a nawet błędne. Taki stan jest konsekwencją tego, że system kadrowo-płacowy jest obsługiwany wyłącznie przez pracowników administracji centralnej i to zaledwie w zakresie zapewniającym poprawne działanie opisu zatrudnienia i naliczania wynagrodzeń. Ponieważ pracownicy są przypisywani do jednostek organizacyjnych stosunkowo wysokiego poziomu (np. Wydziałów) i przesunięcia pracowników między zakładami naukowymi nie zmieniają obciążeń finansowych jednostek, to zdarza się, że takie przesunięcia są dokonywane bez powiadomienia działu spraw pracowniczych, czyli, w konsekwencji bez odnotowania tego faktu w bazie kadrowej. Użytkowany obecnie schemat bazy kadrowej przewiduje zaledwie trzy poziomy hierarchii, co jest często niewystarczające dla celów informacyjnych. Baza nie przewiduje możliwości przypisania jednego pracownika do kilku jednostek organizacyjnych, jeżeli to przypisanie ma wyłącznie charakter organizacyjny, a nie etatowy. Schemat bazy zawiera wprawdzie pola do wpisania adresów e-mail, telefonów służbowych, czy numerów pokoi, ale nie ma miejsca na adres osobistej strony WWW. Dodatkowo zawartość tych pól jest zazwyczaj pusta lub nieaktualna, bo nie utworzono mechanizmów przesyłania informacji z miejsc gdzie ona powstaje do bazy kadrowej. Baza kadrowa jest jednak spójnym i poprawnym źródłem informacji na temat: nazwiska pracownika, stanowiska, tytułów i stopni.

System wspierający tworzenie Spisu Osobowego, to prosta baza danych służąca do tworzenia indeksu oraz tekstowy plik służący do bezpośredniego wydruku. System ten nie zawiera uporządkowanej informacji o przynależności pracowników do jednostek organizacyjnych, chociaż ta informacja jest implicite zawarta w pliku tekstowym i wynika z jego układu graficznego. Dane do spisu są cyklicznie pobierane z jednostek organizacyjnych uczelni, na ogół raz na rok. Ponieważ spis ma wyłącznie formę drukowaną, to nie ma żadnego źródła informacji, które mogłoby być modyfikowane na bieżąco.

Systemy obsługujące konta pracowników są na ogół integralnym fragmentem systemu operacyjnego serwerów. W systemach tych zawarta jest wyłącznie informacja o przypisaniu pracownika do dużej jednostki organizacyjnej (na przykład wydziału), informacja o adresie e-mail na danym serwerze oraz adresie strony WWW (jeżeli jest ona umieszczona na danym serwerze). Informacja o przypisaniu do jednostki powstaje w momencie tworzenia konta i na ogół nie jest modyfikowana. Administratorzy serwerów nie otrzymują informacji o zwolnieniach pracowników. W ramach bieżącego projektu przystąpiono do porządkowania systemów kont poprzez tworzenie jednolitej, rozproszonej bazy LDAP zawierającej informacje niezbędne do obsługi kont, a również do autoryzacji w innych systemach

Sytuacja systemu bibliotecznego jest bardzo podobna do sytuacji systemów na serwerach kont. Wpis na temat pracownika jest tworzony w momencie zakładania konta i modyfikacja danych następuje wyłącznie na wniosek pracownika. Dane określające przypisanie osoby do jednostki organizacyjnej, dane adresowe są często nieaktualne. Nie funkcjonują żadne mechanizmy automatycznej modyfikacji danych.

System obsługi toku studiów składa się z wielu autonomicznych baz, utrzymywanych w kilku typach systemów informatycznych. Począwszy od połowy roku 2003 rozpoczęto intensywne wdrażanie jednolitego systemu obsługi toku studiów – USOS. Do tej pory wykonano załadowanie danych dla jednego wydziału. Ponieważ system USOS wymaga szczegółowych danych na temat pracowników Uczelni, to oczywistą potrzebą jest zasilanie go z innych systemów informatycznych uczelni.

Internetowy system informacyjny ma za zadanie dostarczać danych na temat jednostek organizacyjnych i pracowników uczelni. Zakres dostępnych informacji zależy od użytkownika i jest określony zarządzeniem Rektora UMK. Powszechnym dostępem objęte są podstawowe dane (imię nazwisko, stopień, tytuł naukowy, przynależność do jednostki organizacyjnej, numer pokoju, numer telefonu służbowego, adres poczty elektronicznej) wszystkich nauczycieli akademickich oraz wybranej grupy pracowników informatyki, technicznych i administracji. Pracownikom UMK mogą być udostępniane powyższe dane wszystkich pracowników. System, oparty na serwerze LDAP został zrealizowany jako jedno z zadań niniejszego projektu.

Zaprojektowano następujące przepływy informacji miedzy systemami:

1. system kadrowo-płacowy » internetowy system informacyjny
dane pracowników dotyczące istnienia stosunku pracy, stanowiska, stopnia i tytułu, stopni zawodowych
2. system wspomagający tworzenie Składu Osobowego » internetowy system informacyjny
(wyłącznie w celu jednorazowego, początkowego załadowania danych) dane pracowników dotyczące przypisania do jednostek organizacyjnych, telefonów służbowych, funkcji kierowniczych
3. system kont internetowych » internetowy system informacyjny
adresy e-mail, adresy indywidualnych stron WWW
4. internetowy system informacyjny » baza biblioteczna
przynależność do jednostki organizacyjnej, tytuł i stopień, stopień zawodowy, stanowisko
5. internetowy system informacyjny » system kadrowo-płacowy
kontrola przynależności do jednostek organizacyjnych, telefony służbowe, adresy e-mail
6. internetowy system informacyjny » system obsługi toku studiów
dane pracowników, jednostki organizacyjne i przynależnośc pracowników

Implementacja
W ramach projektu wykonano oprogramowanie dla punktów 1, 2 i 3 i przeprowadzono konwersję danych.

Załadowanie danych do systemu internetowego wykonano wielofazowo. W pierwszej fazie dokonano analizy pliku służącego do wydruku Spisu Osobowego w celu stworzenia listy jednostek organizacyjnych i przyporządkowania im właściwych poziomów zagnieżdżenia w strukturze. Lista ta została następnie zweryfikowana i poprawiona przez dział Organizacji UMK. W drugiej fazie dokonano ponownego przetworzenia Spisu Osobowego w celu przyporządkowania pracowników do jednostek organizacyjnych, opisania funkcji kierowniczych i przypisania numerów telefonów służbowych. Trzecią fazą było skojarzenie otrzymanej bazy danych z systemem kadrowo-płacowym. W tym celu porównywano listy pracowników (imię, nazwisko) uzupełnione o jednostkę organizacyjną wysokiego poziomu (np. Wydział) z obu systemów i w przypadkach jednoznacznej zgodności pobrano z systemu kadrowo-płacowego numery identyfikacyjne pracowników i dopisano je do bazy informacyjnej. Przypadki wątpliwe zostały rozstrzygnięte indywidualnie. W wyniku otrzymano dwa systemy, które pozwalały na jednoznaczną identyfikacje pracownika za pomocą wspólnego numeru identyfikacyjnego. W czwartym kroku dopisano do danych pracowników adresy e-mail poprzez porównanie imienia, nazwiska i jednostki organizacyjnej wysokiego poziomu w systemie informacyjnym i systemie kont internetowych. Opisane powyżej fazy, w rzeczywistości były wielokrotnie powtarzane z powodu błędów w danych wejściowych. Okazało się, że tekstowy plik tworzący Spis Osobowy zawiera wiele niekonsekwencji formatowania, system kadrowo-płacowy zawiera szereg błędów literowych w nazwach jednostek, nie uwzględnia również niepolskich znaków diakrytycznych. Na podstawie analizy rozbieżności między oboma systemami przygotowano szereg poprawek, które zmniejszały wpływ błędów na przetwarzanie danych.

Przypadki występowania jednej osoby w kilku miejscach struktury organizacyjnej obsłużono poprzez wielokrotny wpis oraz dodanie atrybutów "seeAlso".

Przygotowano system synchronizacji danych między systemem informacyjnym a systemem kadrowo-płacowym. Na podstawie systemu kadrowo-płacowego generowana jest lista poprawek do systemu informacyjnego. Tworzone są poprawki dotyczące stanowisk, tytułów, stopni, kasowane są osoby, które nie występują w systemie kadrowo-płacowym. Nowe osoby, są wpisywane do systemu informacyjnego ze specjalnym statusem i podlegają indywidualnej weryfikacji co do przynależności do jednostek organizacyjnych.

Moduł administrowania danymi w systemie informacyjnym pozwala na wprowadzanie poprawek w zakresie przynależności do jednostek organizacyjnych. Na podstawie porównania z systemem kadrowo-płacowym generowane będą listy rozbieżności, które pozwolą na utrzymanie bazy kadrowo-płacowej na wysokim poziomie aktualności. Administrowanie danymi pracowników w systemie informacyjnym LDAP będzie się odbywało w sposób rozproszony (będzie rozdzielone pomiędzy właściwe jednostki organizacyjne). Modyfikować można wyłącznie dane, które nie są automatycznie pobierane z systemu kadrowo-płacowego. Ten model pozwala na utrzymanie spójności obu baz pomimo niezależnego administrowania.

Po wprowadzeniu jednolitego systemu kodów dla jednostek organizacyjnych zapewniona zostanie pełna synchronizacja w zakresie nazewnictwa jednostek.

Na podstawie systemu informacyjnego LDAP utworzonego zgodnie z opisaną procedurą, załadowano dane o pracownikach UMK do systemu obsługi studiów USOS. Do tego systemu wprowadzono również identyfikatory pracowników, zapewniając w ten sposób możliwość pełnej synchronizacji.

Systemy obsługujące konta pracowników są obecnie również prowadzone w oparciu o serwery LDAP. Ze względu na niezawodność i bezpieczeństwo przyjęto rozdzielenie obu baz, ale obydwa systemy mogą być synchronizowane na podstawie numerów identyfikacyjnych pracowników. Dzięki temu możliwe jest utrzymywanie aktualnych adresów e-mail w systemie informacyjnym, a jednocześnie aktualizowanie systemów obsługi kont poprzez wykreślanie kont osób, które przestały być pracownikami Uczelni.

Przeprowadzono analizę możliwości synchronizacji bazy bibliotecznej z pozostałymi systemami informatycznymi i ustalono, że z uwagi na bardzo niską możliwość identyfikacji pracownika w bazie bibliotecznej, praktycznie niemożliwe jest wykonanie synchronizacji automatycznie. Planowane wprowadzenie nowych kart bibliotecznych, a właściwie identyfikatorów pracowniczych, będzie dobrą okazją do weryfikacji danych i wprowadzenia do bazy bibliotecznej numerów identyfikacyjnych pracowników.