Stripped out non-XML formats in preparation for new schedproc script
[tpope-extra.git] / perl / sct6
index fde8f7f75d5604370c5dfb199f692ef845b48b7f..ffb1cbbc7031f977070430a865652f5ac98c8603 100755 (executable)
--- a/perl/sct6
+++ b/perl/sct6
@@ -7,12 +7,13 @@
 # You'll need to change the url below if you go anywhere but TAMUK.
 
 use strict;
-use LWP::UserAgent;
-use HTML::TableExtract;
-#use Time::Local;
 use Date::Calc::Object qw(Day_of_Week Decode_Day_of_Week Decode_Month Week_of_Year Monday_of_Week Day_of_Week_Abbreviation Delta_Days Add_Delta_Days Nth_Weekday_of_Month_Year Gmtime Mktime);
 use Date::Calendar::Profiles qw($Profiles);
 use Date::Calendar::Year;
+use HTML::TableExtract;
+use LWP::UserAgent;
+use IO::File;
+use XML::Writer;
 use vars qw($ua %opts %faculty);
 
 my ($response);
@@ -91,7 +92,7 @@ $response = $ua->post("${url}twbkwbis.P_ValLogin", { sid => $opts{SID}, PIN => $
 
 $response = $ua->get("${url}bwskflib.P_SelDefTerm"); # Valid terms
 die $response->status_line unless $response->is_success;
-my @terms = grep {s/^<option value="([^"]*)">.*/$1/i} (split( /\r?\n/, $response->content));
+my @terms = grep {s/^<option value="([^"]*)">.*/$1/i} (split( /\r?\n/, $response->content)); # "
 die "Site down. Try again later.\n" unless (@terms);
 
 sub generate_id {
@@ -187,8 +188,7 @@ sub capitalize {
     s/\bUs\b/US/g;
     s/ (And|For|Of|Or|The|To|With) / \l$1 /g;
     s/\b(Mc)([a-z])/$1\u$2/g;
-    s/\bTba\b/TBA/g;
-    s/\b(Tcp\/Ip|Pc)\b/\U$&/g;
+    s/\b(Tcp\/Ip|Pc|Tba)\b/\U$&/g;
     s/\bThru\b/Through/g;
     s/\bAcct\b/Accounting/g;
     s/\bAmer\b/American/g;
@@ -203,12 +203,14 @@ sub capitalize {
     s/\bLit\b/Literature/g;
     s/\bPrin\b/Principles/g;
     s/\bBus\b/Business/g;
+    s/\bSyst\b/Sys/g;
     return $_;
 }
 
 sub get_schedule_terms {
     my (@sterms, @a);
-    @a=('10','20','30','40'); # XXX 10 is fall, others are speculation
+    @a=('10','20','30','40');  # Fall, Spring, Summer I, Summer II
+                               # Last 3 are currently guesses
     my @localtime=localtime();
     if ($localtime[4]<3) { # Through Mar 31
        @sterms=((1900+$localtime[5]).$a[1]);
@@ -230,8 +232,6 @@ sub get_schedule {
     my @readheaders = ("Type", "Time", "Days", "Where", "Date Range", "Schedule Type", "Instructors");
     my @class;
     my $te = new HTML::TableExtract( headers => [ @readheaders ] );
-    #@readheaders = ("Course", "Days\xa0TimeLocation", "Session and Dates", "Instructor", "Credit", "CallNumber", "GradeType", "Message");
-    my $tf = new HTML::TableExtract( headers => [ @readheaders ] );
     my (@schedule, @terms, $classid, $title, $begin, $end, $times, $days, $session);
     @terms = get_schedule_terms();
     foreach (@_ ? @_ : @terms) {
@@ -242,8 +242,6 @@ sub get_schedule {
            next unless $l =~ s/.*<CAPTION class=[^>]*>(.* - .... \d\d\d\d \d\d\d)<\/caption>.*/$1/i;
            push @class, $l;
        }
-       #$tf->parse($response->content);
-       #print $response->content;
     }
     foreach my $ts ($te->table_states) {
        foreach my $row ($ts->rows) {
@@ -255,44 +253,38 @@ sub get_schedule {
            $classid =~ s/.* - //;
            $classid =~ s/ /-/g;
            $title =~ s/ - .*//;
+           $row->[6] =~ s/\b([A-Z]r?)$/$1./;
            $row->[6] = capitalize($row->[6]);
-           $row->[6] =~ s/([A-Z]r?)$/$1./;
            $row->[6] =~ s/ *\([A-Z]\)//;
            $row->[1] =~ s/ ?([ap])m/\u$1M/g;
            $row->[1] =~ s/ - /-/;
            ($begin, $end) = split(/ ?- ?/, $row->[1]);
            $begin =~ s/^(\d):/0$1:/;
            $end =~ s/^(\d):/0$1:/;
-           if ($begin =~ /pm$/i && $begin !~ /^12/) {
-               $begin =~ s/^(\d?\d)/$1+12/e;
+           if (($begin=~/PM$/ && $begin!~/^12/)||($begin=~/^12:..AM/)) {
+               $begin =~ s/^(\d?\d)/($1+12)%24/e;
            }
-           if ($end =~ /pm$/i && $end !~ /^12/) {
-               $end =~ s/^(\d?\d)/$1+12/e;
+           if (($end=~/PM$/ && $end!~/^12/)||($end=~/^12:..AM/)) {
+               $end =~ s/^(\d?\d)/($1+12)%24/e;
            }
            $begin =~ s/ ?[AP]M//;
            $end =~ s/ ?[AP]M//;
            $row->[4] =~ s/([A-Za-z]{3,9})/(Decode_Month($1)<10?"0":"").Decode_Month($1)/eg;
            $row->[4] =~ s/(\d\d?) (\d\d), (\d\d\d\d)/$3$1$2/g;
-           $row->[4] =~ s/ - /\n/;
+           $row->[4] =~ s/ - /-/;
            $row->[3] =~ s/(ON|MAIN) CAMPUS\n|Palo Alto Building \d* //ig;
            $row->[3] =~ s/\n/ /g;
            push @schedule, {
                id => $classid,
-               title => $title,
-               #session => $row->[1],
+               title => capitalize($title),
                instructor => $row->[6],
-               #credits => $row->[3],
-               #callnumber => $row->[4],
-               #gradetype => $row->[5],
                days => $row->[2],
-               'time' => $row->[1],
+               #'time' => $row->[1],
                begin => $begin,
                end => $end || undef,
                duration => $row->[4],
                location => $row->[3],
-               #message => $row->[10],
            };
-           #print join (" ", values %{$schedule[$#schedule]}), "\n";
        }
     }
     return @schedule;
@@ -304,9 +296,9 @@ sub get_faculty_email {
        open INS, $ENV{'HOME'} . "/public_html/faculty.csv";
        while($_ = <INS>) {
            chomp;
-           m/"([^"]*)",([^,]*),([^,]*)/;
+           m/"([^"]*)",([^,]*),([^,]*)/; # "
            ($name, $email, $school) = ($1, $2, $3);
-           $name =~ s/^([^,]*), ([^,]*)(.*)$/$2 $1$3/;
+           #$name =~ s/^([^,]*), ([^,]*)(.*)$/$2 $1$3/;
            $name =~ s/ [A-Z]\.//g;
            $name = lc $name;
            $name =~ s/\W//g;
@@ -372,7 +364,7 @@ sub do_mhc_schedule {
        $current .= "X-SC-Alarm: 15 minutes\n";
        $current .= "X-SC-Record-Id: <".$row->{'id'}."\@from.sctweb>\n";
        if(defined($file) && (-d $file)) {
-           $row->{'instructor'} =~ s/^([^,]*), ([^,]*)(.*)/$2 $1$3/;
+           #$row->{'instructor'} =~ s/^([^,]*), ([^,]*)(.*)/$2 $1$3/;
            my $email = get_faculty_email $row->{'instructor'};
            $row->{'instructor'} = '"' . $row->{'instructor'} . '" <'. ($email || ($1 || "unknown") . "\@from.sctweb") . ">";
            $row->{'duration'} =~ /^(\d\d\d\d)(\d\d)(\d\d)-\d{8}$/;
@@ -424,7 +416,7 @@ sub do_csv_schedule {
        my $id=generate_id($row->{'id'});
        $row->{'days'} =~ s/([MTWRFS])/ $days{$1}/g;
        $row->{'days'} =~ s/^ //;
-       $row->{'instructor'} =~ s/^([^,]*), ([^,]*)/$2 $1/;
+       #$row->{'instructor'} =~ s/^([^,]*), ([^,]*)(.*)$/$2 $1$3/;
        my $next = next_class(%$row);
        $current = "";
        #print "# $id\n";
@@ -447,7 +439,7 @@ sub do_vcalendar_schedule {
     print "BEGIN:VCALENDAR\r\nVERSION:1.0\r\n";
     foreach my $row (@schedule) {
        map { s/\n/-/g; $_} %$row;
-       $row->{'instructor'} =~ s/^([^,]*), ([^,]*)/$2 $1/;
+       #$row->{'instructor'} =~ s/^([^,]*), ([^,]*)/$2 $1/;
        $row->{'days'} =~ s/([MTWRFS])/ $days{$1}/g;
        $row->{'days'} =~ s/^ //;
        #$row->{'duration'} =~ s/(\d\d)-(\d\d)-(\d\d)/20$3$1$2/g;
@@ -487,6 +479,29 @@ sub do_vcalendar_schedule {
     print "END:VCALENDAR\r\n";
 }
 
+sub do_xml_schedule {
+    my $file = shift if (defined $_[0] and $_[0] !~ /^\d/);
+    my ($output, $writer);
+    if($file) {
+       $output = new IO::File(">$file");
+       $writer = new XML::Writer(OUTPUT => $output, DATA_MODE => 1);
+    } else {
+       $writer = new XML::Writer(DATA_MODE => 1);
+    }
+    my @schedule = get_schedule(@_);
+    $writer->startTag("schedule");
+    foreach my $class (@schedule) {
+       $writer->startTag("class");
+       foreach my $key (sort keys %$class) {
+           $writer->dataElement($key, $class->{$key});
+       }
+       $writer->endTag("class");
+    }
+    $writer->endTag("schedule");
+    $writer->end();
+    close $output if $file;
+}
+
 sub do_html_schedule {
     my @showheaders = ("Section ID/Title", "Instructor", "Days", "Time", "Duration", "Location");
     my $shade = "dark";
@@ -496,7 +511,7 @@ sub do_html_schedule {
     print "</th></tr>\n";
        foreach my $row (@schedule) {
            map { s/\n/<br \/>/g; $_} %$row;
-           $row->{'time'} =~ s/-/-<wbr \/>/;
+           $row->{'duration'} =~ s/-/<br \/>/g;
            $row->{'duration'} =~ s/\d\d(\d\d)(\d\d)(\d\d)/$2-$3-$1/g;
            print '<tr class="'.$shade.'">';
            $shade = ($shade eq "dark"?"light":"dark");
@@ -504,7 +519,7 @@ sub do_html_schedule {
            print '<span class="sectionid">' .$row->{'id'}. '</span><br />';
            print '<span class="coursetitle">' .$row->{'title'}. '</span></td>';
            my $instructor = $row->{'instructor'};
-           $instructor =~ s/^([^,]*), ([^,]*)(.*)/$2 $1$3/;
+           #$instructor =~ s/^([^,]*), ([^,]*)(.*)/$2 $1$3/;
            my $email = get_faculty_email($instructor);
            #if($email) {
                #print '<td><a href="mailto:' . $email . '">'
@@ -513,7 +528,7 @@ sub do_html_schedule {
                print "<td>" . $row->{'instructor'} . "</td>";
            #}
            print "<td>" . $row->{'days'} . "</td>";
-           print "<td>" . $row->{'time'} . "</td>";
+           print "<td>" . $row->{'begin'}."-<wbr />".$row->{'end'} . "</td>";
            print "<td>" . $row->{'duration'} . "</td>";
            print "<td>" . $row->{'location'} . "</td>";
            print "</tr>\n";
@@ -574,24 +589,6 @@ sub do_html_grades {
     print "</table>\n";
 }
 
-sub do_faculty {
-    my @readheaders = ("Name", "College", "Email");
-    my $te = new HTML::TableExtract( headers => [ @readheaders ] );
-    foreach(qw(a b c d e f g h i j k l m n o p q r s t u v w x y z)) {
-       my $response = $ua->get("http://$domain/fs/".$_."dir.htm");
-       die $response->status_line unless $response->is_success;
-       $te->parse($response->content);
-    }
-    foreach my $ts ($te->table_states) {
-       foreach my $row ($ts->rows) {
-           map { s/[\r\n]//g; $_} @$row;
-           $row->[0] = capitalize($row->[0]);
-           $row->[0] =~ s/([A-Z]r?)$/$1./;
-           print '"'.$row->[0].'",',$row->[2].',', $row->[1], "\n";
-       }
-    }
-}
-
 sub do_transcripts {
     $response = $ua->get("$url&tserve_tip_write=||WID|SID|PIN&tserve_trans_config=rtranscr.cfg&CareerReqNum=1");
     foreach (split /\n/, $response->content) {
@@ -602,9 +599,7 @@ sub do_transcripts {
     }
 }
 
-if ($arg eq "-g") {
-    do_html_grades(@ARGV);
-} elsif ($arg eq "-s") {
+if ($arg eq "-s" || $arg eq "-h") {
     do_html_schedule(@ARGV);
 } elsif ($arg eq "-m") {
     do_mhc_schedule(@ARGV);
@@ -612,10 +607,14 @@ if ($arg eq "-g") {
     do_csv_schedule(@ARGV);
 } elsif ($arg eq "-v") {
     do_vcalendar_schedule(@ARGV);
+} elsif ($arg eq "-g") {
+    die "Grade support currently broken.\n";
+    do_html_grades(@ARGV);
 } elsif ($arg eq "-t") {
+    die "Transcript support currently broken.\n";
     do_transcripts;
-} elsif ($arg eq "-f") {
-    do_faculty;
+} elsif ($arg eq "-x" || 1) {
+    do_xml_schedule(@ARGV);
 }
 
 $ua->get("${url}twbkwbis.P_Logout"); # Logout