Die Verwendung von GTFS-RT geht davon aus, dass als Basis eine statische GTFS-Datei verwendet wird.
Die Open Data Plattform stellt ein solches zur Verfügung.
Viele Akteure bevorzugen aber das (mächtigere) HRDF-Format.
Im HRDF bilden die folgenden Felder einer Fahrt einen eindeutigen Schlüssel:
- „Fahrtnummer“
- „Verwaltung“
- „Variante“
Diese findet sich in der „*Z-Zeile“ der Datei „FPLAN“.
Im GTFS (und GTFS-RT) ist dies die „Trip_ID“ in der Datei „trips.txt“. Die Routen (in „routes.txt“) und trips werden automatisch nummeriert. D.h. sie sind auch zwischen GTFS-Versionen nicht stabil.
Wenn der eigentliche Fahrplan aus HRDF stammen soll und ihre Algorithmen darauf ausgelegt sind, so müssen sie dennoch das GTFS Static in ihre Datenbank importieren und ein Matching erzeugen.
Es wird folgendes Vorgehen empfohlen.
Importieren Sie das aktuelle GTFS Static in Ihre Datenbank
Importieren Sie das aktuelle GTFS Static in eine Datenbank (z.B. mit https://github.com/cbick/gtfs_SQL_importer). Als Beispiel ein einfaches SQL-Skript
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 |
drop table GTFS_agency; drop table GTFS_calendar; drop table GTFS_calendar_dates; drop table GTFS_routes; drop table GTFS_stops; drop table GTFS_stop_times; drop table GTFS_trips; create table GTFS_agency(agency_id TEXT,agency_name TEXT,agency_url TEXT, agency_timezone TEXT,agency_lang TEXT, agency_phone TEXT); create table GTFS_calendar(service_id TEXT,monday NUMERIC, tuesday NUMERIC, wednesday NUMERIC, thursday NUMERIC, friday NUMERIC, saturday NUMERIC, sunday NUMERIC,start_date NUMERIC,end_date NUMERIC); create table GTFS_calendar_dates(service_id TEXT,date NUMERIC,exception_type NUMERIC); create table GTFS_routes(route_id TEXT,agency_id TEXT,route_short_name TEXT, route_long_name TEXT,route_type NUMERIC ); -- create table shapes(shape_id TEXT,shape_pt_lat REAL,shape_pt_lon REAL, shape_pt_sequence NUMERIC); create table GTFS_stops(stop_id TEXT,stop_name TEXT, stop_lat REAL,stop_lon REAL, location_type TEXT,parent_station TEXT ); create table GTFS_stop_times(trip_id TEXT,arrival_time TEXT,departure_time TEXT, stop_id TEXT,stop_sequence NUMERIC, pickup_type NUMERIC,drop_off_type NUMERIC); create table GTFS_trips(route_id TEXT,service_id TEXT,trip_id TEXT, trip_headsign TEXT,direction_id NUMERIC ); .separator ',' .import GTFS_Import/agency.txt GTFS_agency .import GTFS_Import/calendar.txt GTFS_calendar .import GTFS_Import/calendar_dates.txt GTFS_calendar_dates .import GTFS_Import/routes.txt GTFS_routes -- .import GTFS_Import/shapes.txt shapes .import GTFS_Import/stops.txt GTFS_stops .import GTFS_Import/stop_times.txt GTFS_stop_times .import GTFS_Import/trips.txt GTFS_trips delete from GTFS_agency where agency_id like 'agency_id'; delete from GTFS_calendar_dates where service_id like 'service_id'; delete from GTFS_routes where route_id like 'route_id'; -- delete from shapes where shape_id like 'shape_id'; delete from GTFS_stops where stop_id like 'stop_id'; delete from GTFS_stop_times where trip_id like 'trip_id'; delete from GTFS_trips where route_id like 'route_id'; |
Ein Verständnis der Struktur von GTFS ist notwendig: https://developers.google.com/transit/gtfs/reference/
Importieren Sie die notwendigen Daten aus dem HRDF in eine Datenbank
Sie müssen aus verschiedenen Dateien des HRDF Daten importieren. Die Struktur ist hier beschrieben: https://opentransportdata.swiss/wp-content/uploads/2016/10/hrdf.pdf
Aus „FPLAN“:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
*Z Zeile 1-2 *Z 4-8 INT32 Fahrtnummer 10-15 CHAR Verwaltung 19-21 INT16 Variante * G Zeile 1-2 *G 4-6 CHAR Verkehrsmittel bzw. Gattung 8-14 INT32 optional Haltestelle, ab der die Gattung gilt 16-22 INT32 optional Haltestellennummer, bis zu der die Gattung gilt 24-29 INT32 optional Abfahrtszeitpunkt 31-36 INT32 optional Ankunftszeitpunkt * L Zeile 1-2 *L 4-11 CHAR Liniennummer *I Zeilen 1-2 *I 4-5 Z0 ursprünglicher >Zug 4-5 ZN 30-36 Infotextnummer * R Zeile 1-2 *R 4-4 CHAR Richtungskennung * Laufwegzeilen 1-7 Haltestellenummer 30-35 -INT32 Ankunftszeit an der Haltestelle 37-42 INT32 Abfahrts ab Haltestelle */ |
Die Verkehrsperioden müssen auch integriert werden (Datei „BITFELD“). Sie brauchen diese, um die Verkehrstage zu ermitteln.
Aus der Datei „INFOTEXT“ wird benötigt, um bei Ausfällen die korrekte Zugnummer zu identifzieren. Wenn die Zugnummer wechselt (bei Ausfällen), so wird in „INFOTEXT“ im Feld „Infotext“ die ursprüngliche Zugnummer abgelegt. D.h. der Wert von „Z0“ im HRDF muss noch korrekt referenziert werden.
Die Durchbindungen müssen auch importiert werden. Durchbindungen sind zwei Fahrten, die durch denselben Zug durchgeführt werden. Die Durchbindungen sind in der Datei „DURCHBI“ enthalten:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 |
10480 000881 8587086 10481 000881 000000 8587086 % 10486 000881 8587086 10487 000881 000000 8587086 % 10502 000801 8507867 10501 000801 000000 8507867 % Unterseen, Spital Interlaken 10502 000801 8507867 90501 000801 000000 8507867 % Unterseen, Spital Interlaken 10504 000801 8507867 10503 000801 000000 8507867 % Unterseen, Spital Interlaken 10504 000801 8507867 90505 000801 000000 8507867 % Unterseen, Spital Interlaken 10510 000801 8507867 10509 000801 000000 8507867 % Unterseen, Spital Interlaken 10512 000801 8507867 10511 000801 000000 8507867 % Unterseen, Spital Interlaken 10514 000801 8507867 10513 000801 000000 8507867 % Unterseen, Spital Interlaken 10516 000801 8507867 10515 000801 000000 8507867 % Unterseen, Spital Interlaken 10518 000801 8507867 10517 000801 000000 8507867 % Unterseen, Spital Interlaken 10520 000037 8500063 10528 000037 000525 8500063 % 00063 50505T R 50505T R 25:28 - 25:28 25:28 - 25:28 10520 000801 8507867 10519 000801 000000 8507867 % Unterseen, Spital Interlaken 10522 000773 8594188 07059 000773 000000 8594188 % 10522 000801 8507867 10521 000801 000000 8507867 % Unterseen, Spital Interlaken 10523 000773 8594188 04839 000773 000000 8594188 % 10524 000801 8507867 10523 000801 000000 8507867 % Unterseen, Spital Interlaken 10526 000773 8590892 10418 000773 000000 8590892 % 10526 000801 8507867 10525 000801 000000 8507867 % Unterseen, Spital Interlaken 10528 000801 8507867 10527 000801 000000 8507867 % Unterseen, Spital Interlaken 10530 000801 8507867 10529 000801 000000 8507867 % Unterseen, Spital Interlaken 10532 000801 8507867 10531 000801 000000 8507867 % Unterseen, Spital Interlaken 10534 000801 8507867 10533 000801 000000 8507867 % Unterseen, Spital Interlaken 10536 000801 8507867 10535 000801 000000 8507867 % Unterseen, Spital Interlaken 10538 000801 8507867 10537 000801 000000 8507867 % Unterseen, Spital Interlaken 10540 000801 8507867 10539 000801 000000 8507867 % Unterseen, Spital Interlaken 10542 000801 8507867 10541 000801 000000 8507867 % Unterseen, Spital Interlaken 10544 000801 8507867 10543 000801 000000 8507867 % Unterseen, Spital Interlaken 10548 000801 8507867 10549 000801 000000 8507867 % Unterseen, Spital Interlaken 10550 000801 8507867 10551 000801 000000 8507867 % Unterseen, Spital Interlaken 10552 000801 8507867 10553 000801 000000 8507867 % Unterseen, Spital Interlaken 10554 000801 8507867 10555 000801 000000 8507867 % Unterseen, Spital Interlaken 10560 000801 8507867 10559 000801 000000 8507867 % Unterseen, Spital Interlaken 10562 000801 8507867 10561 000801 000000 8507867 % Unterseen, Spital Interlaken 10605 000841 8588626 28023 000841 000000 8588626 % 88626 60110E R 60528E R 07:03 - 07:06 07:04 - 07:15 10607 000841 8588626 28033 000841 000000 8588626 % 88626 60110E R 60528E R 08:03 - 08:06 08:04 - 08:15 10625 000841 8588626 28123 000841 000010 8588626 % 88626 60110E R 60528E R 17:12 - 17:15 17:13 - 17:15 10627 000841 8588626 28133 000841 000010 8588626 % 88626 60110E R 60528E R 18:12 - 18:15 18:13 - 18:15 10629 000841 8588626 28143 000841 000010 8588626 % 88626 60110E R 60528E R 19:12 - 19:15 19:13 - 19:15 10653 03____ 8015187 10357 03____ 090720 8015187 % |
Im GTFS sind die Durchbindungen bereits zusammengehängt, um den Trip zu bilden. Also Trip A und Trip B, die im HRDF über DURCHBI verbunden sind, sind im GTFS bereits als A->B drin.
Im Minimum sollten im Record enthalten sein:
- Fahrtnummer
- Verwaltung
- Variante
- Startort
- Zielort
- Startzeit
- Zielzeit
- Linie
- Richtung
- Verkehrsperiode
- Z0
- ZN
Matching der Daten
Sie können jetzt die Records matchen über:
- Startort
- Startzeit
- Zielort
- Zielzeit
- Richtung
- Verkehrstag
Es ist auch ein Matching über den Laufweg möglich, dann kann auf den Verkehrstag verzichtet werden. Beim Matching über den Laufweg wird die genaue Strecke gematcht.
Beachten Sie:
- Es gibt mehr Trips in GTFS als Fahrten in HRDF.
- Grenzüberschreitende Züge werden am Grenzbahnhof trunkiert auf der Opendata-Plattform. Wenn Sie die Fahrpläne aus einer anderen Quelle haben, so kann dies anders sein.
- Sie können Startort/Zielort auch aus dem Laufweg von „FPLAN“ ermitteln.
Das Matching kann statisch oder dynamisch erfolgen, je nachdem, was Ihre Anwendung braucht. Sie müssen aber auf jeden Fall den relevanten Tag einbeziehen, da sie den entsprechenden Trip und den entsprechenden HRDF-FPLAN-Eintrag nur so eindeutig identifizieren können. Beispielsweise:
- Sie können dies z.B. mit einer Funktion getTripfromHRDF (FahrtID, Verwaltung, Version , Betriebstag) durchführen.
- Sie können eine Funktion getHRDFfromTrip(trip_id, Betriebstag) erstellen.
- Sie erstellen für jeden Betriebstag eine View/Tabelle der Trips und ihrem Mapping zum HRDF (Achtung: Im ungünstigsten Fall 130‘000 Fahrten x 400 Tage)