Diff for /loncom/loncron between versions 1.93 and 1.103

version 1.93, 2011/11/03 22:32:04 version 1.103, 2015/09/20 18:31:21
Line 32  use strict; Line 32  use strict;
   
 use lib '/home/httpd/lib/perl/';  use lib '/home/httpd/lib/perl/';
 use LONCAPA::Configuration;  use LONCAPA::Configuration;
   use LONCAPA::Checksumming;
 use LONCAPA;  use LONCAPA;
 use Apache::lonnet;  use Apache::lonnet;
 use Apache::loncommon;  use Apache::loncommon;
Line 156  sub checkon_daemon { Line 157  sub checkon_daemon {
  $errors++;   $errors++;
  my $kadaemon=$daemon;   my $kadaemon=$daemon;
  if ($kadaemon eq 'lonmemcached') { $kadaemon='memcached'; }   if ($kadaemon eq 'lonmemcached') { $kadaemon='memcached'; }
  &log($fh,'<br><font color="red">Killall '.$daemon.': '.   &log($fh,'<br /><font color="red">Killall '.$daemon.': '.
     `killall $kadaemon 2>&1`.' - ');      `killall $kadaemon 2>&1`.' - ');
  sleep 1;   sleep 1;
  &log($fh,unlink($pidfile).' - '.   &log($fh,unlink($pidfile).' - '.
     `killall -9 $kadaemon 2>&1`.      `killall -9 $kadaemon 2>&1`.
     '</font><br>');      '</font><br />');
  &log($fh,"<h3>$daemon not running, trying to start</h3>");   &log($fh,"<h3>$daemon not running, trying to start</h3>");
   
  if (&start_daemon($fh,$daemon,$pidfile,$args)) {   if (&start_daemon($fh,$daemon,$pidfile,$args)) {
Line 270  sub log_machine_info { Line 271  sub log_machine_info {
   
     &log($fh,"<h3>distprobe</h3>");      &log($fh,"<h3>distprobe</h3>");
     &log($fh,"<pre>");      &log($fh,"<pre>");
     open(DSH,"$perlvar{'lonDaemons'}/distprobe |");      &log($fh,&encode_entities(&LONCAPA::distro(),'<>&"'));
     while (my $line=<DSH>) {   
  &log($fh,&encode_entities($line,'<>&"'));   
  $psproc++;  
     }  
     close(DSH);  
     &log($fh,"</pre>");      &log($fh,"</pre>");
   
     &errout($fh);      &errout($fh);
Line 289  sub start_logging { Line 285  sub start_logging {
           
   
     &log($fh,(<<ENDHEADERS));      &log($fh,(<<ENDHEADERS));
 <html>  <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
   <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
 <head>  <head>
 <title>LON Status Report $perlvar{'lonHostID'}</title>  <title>LON Status Report $perlvar{'lonHostID'}</title>
   <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
 </head>  </head>
 <body bgcolor="#AAAAAA">  <body bgcolor="#AAAAAA">
 <a name="top" />  <a name="top" />
Line 302  sub start_logging { Line 300  sub start_logging {
 <li><a href="#machine">Machine Information</a></li>  <li><a href="#machine">Machine Information</a></li>
 <li><a href="#tmp">Temporary Files</a></li>  <li><a href="#tmp">Temporary Files</a></li>
 <li><a href="#tokens">Session Tokens</a></li>  <li><a href="#tokens">Session Tokens</a></li>
   <li><a href="#webdav">WebDAV Session Tokens</a></li>
 <li><a href="#httpd">httpd</a></li>  <li><a href="#httpd">httpd</a></li>
 <li><a href="#lonsql">lonsql</a></li>  <li><a href="#lonsql">lonsql</a></li>
 <li><a href="#lond">lond</a></li>  <li><a href="#lond">lond</a></li>
Line 332  ENDHEADERS Line 331  ENDHEADERS
     "</td><td>".$role.      "</td><td>".$role.
     "</td><td>".&Apache::lonnet::hostname($id)."</td></tr>\n");      "</td><td>".&Apache::lonnet::hostname($id)."</td></tr>\n");
     }      }
     &log($fh,"</table><h3>Spare Hosts</h3><ul>");      &log($fh,"</table><h3>Spare Hosts</h3>");
     foreach my $type (sort(keys(%Apache::lonnet::spareid))) {      if (keys(%Apache::lonnet::spareid) > 0) {
  &log($fh,"<li>$type\n<ol>");          &log($fh,"<ul>");
  foreach my $id (@{ $Apache::lonnet::spareid{$type} }) {          foreach my $type (sort(keys(%Apache::lonnet::spareid))) {
     &log($fh,"<li>$id</li>\n");      &log($fh,"<li>$type\n<ol>");
  }      foreach my $id (@{ $Apache::lonnet::spareid{$type} }) {
  &log($fh,"</ol>\n</li>\n");          &log($fh,"<li>$id</li>\n");
       }
       &log($fh,"</ol>\n</li>\n");
           }
           &log($fh,"</ul>\n");
       } else {
           &log($fh,"No spare hosts specified<br />\n");
     }      }
     &log($fh,"</ul>\n");  
     return $fh;      return $fh;
 }  }
   
Line 486  sub clean_lonIDs { Line 490  sub clean_lonIDs {
  my $since=$now-$mtime;   my $since=$now-$mtime;
  if ($since>$perlvar{'lonExpire'}) {   if ($since>$perlvar{'lonExpire'}) {
     $cleaned++;      $cleaned++;
     &log($fh,"Unlinking $fname<br>");      &log($fh,"Unlinking $fname<br />");
     unlink("$fname");      unlink("$fname");
  } else {   } else {
     $active++;      $active++;
Line 496  sub clean_lonIDs { Line 500  sub clean_lonIDs {
     &log($fh,"<h3>$active open session(s)</h3>");      &log($fh,"<h3>$active open session(s)</h3>");
 }  }
   
   # ------------------------------------------------ clean out webDAV Session IDs
   sub clean_webDAV_sessionIDs {
       my ($fh)=@_;
       if ($perlvar{'lonRole'} eq 'library') {
           &log($fh,'<hr /><a name="webdav" /><h2>WebDAV Session Tokens</h2>');
           my $cleaned=0;
           my $active=0;
           my $now = time;
           if (-d $perlvar{'lonDAVsessDir'}) {
               while (my $fname=<$perlvar{'lonDAVsessDir'}/*>) {
                   my @stats = stat($fname);
                   my $since=$now-$stats[9];
                   if ($since>$perlvar{'lonExpire'}) {
                       $cleaned++;
                       &log($fh,"Unlinking $fname<br />");
                       unlink("$fname");
                   } else {
                       $active++;
                   }
               }
               &log($fh,"<p>Cleaned up ".$cleaned." stale webDAV session token(s).</p>");
               &log($fh,"<h3>$active open webDAV session(s)</h3>");
           }
       }
   }
   
 # ----------------------------------------------------------- clean out sockets  # ----------------------------------------------------------- clean out sockets
 sub clean_sockets {  sub clean_sockets {
     my ($fh)=@_;      my ($fh)=@_;
Line 515  sub clean_sockets { Line 545  sub clean_sockets {
 # ----------------------------------------------------------------------- httpd  # ----------------------------------------------------------------------- httpd
 sub check_httpd_logs {  sub check_httpd_logs {
     my ($fh)=@_;      my ($fh)=@_;
     if (open(PIPE,"lchttpdlogs|")) {      if (open(PIPE,"./lchttpdlogs|")) {
         while (my $line=<PIPE>) {          while (my $line=<PIPE>) {
             &log($fh,$line);              &log($fh,$line);
             if ($line=~/\[error\]/) { $notices++; }              if ($line=~/\[error\]/) { $notices++; }
Line 530  sub check_httpd_logs { Line 560  sub check_httpd_logs {
 sub rotate_lonnet_logs {  sub rotate_lonnet_logs {
     my ($fh)=@_;      my ($fh)=@_;
     &log($fh,'<hr /><a name="lonnet" /><h2>lonnet</h2><h3>Temp Log</h3><pre>');      &log($fh,'<hr /><a name="lonnet" /><h2>lonnet</h2><h3>Temp Log</h3><pre>');
     print "checking logs\n";      print "Checking logs.\n";
     if (-e "$perlvar{'lonDaemons'}/logs/lonnet.log"){      if (-e "$perlvar{'lonDaemons'}/logs/lonnet.log"){
  open (DFH,"tail -n50 $perlvar{'lonDaemons'}/logs/lonnet.log|");   open (DFH,"tail -n50 $perlvar{'lonDaemons'}/logs/lonnet.log|");
  while (my $line=<DFH>) {    while (my $line=<DFH>) { 
Line 574  sub rotate_other_logs { Line 604  sub rotate_other_logs {
 sub test_connections {  sub test_connections {
     my ($fh)=@_;      my ($fh)=@_;
     &log($fh,'<hr /><a name="connections" /><h2>Connections</h2>');      &log($fh,'<hr /><a name="connections" /><h2>Connections</h2>');
     print "testing connections\n";      print "Testing connections.\n";
     &log($fh,"<table border='2'>");      &log($fh,"<table border='2'>");
     my ($good,$bad)=(0,0);      my ($good,$bad)=(0,0);
     my %hostname = &Apache::lonnet::all_hostnames();      my %hostname = &Apache::lonnet::all_hostnames();
Line 608  sub test_connections { Line 638  sub test_connections {
 sub check_delayed_msg {  sub check_delayed_msg {
     my ($fh)=@_;      my ($fh)=@_;
     &log($fh,'<hr /><a name="delayed" /><h2>Delayed Messages</h2>');      &log($fh,'<hr /><a name="delayed" /><h2>Delayed Messages</h2>');
     print "checking buffers\n";      print "Checking buffers.\n";
           
     &log($fh,'<h3>Scanning Permanent Log</h3>');      &log($fh,'<h3>Scanning Permanent Log</h3>');
   
Line 619  sub check_delayed_msg { Line 649  sub check_delayed_msg {
  my ($time,$sdf,$dserv,$dcmd)=split(/:/,$line);   my ($time,$sdf,$dserv,$dcmd)=split(/:/,$line);
  if ($sdf eq 'F') {    if ($sdf eq 'F') { 
     my $local=localtime($time);      my $local=localtime($time);
     &log($fh,"<b>Failed: $time, $dserv, $dcmd</b><br>");      &log($fh,"<b>Failed: $time, $dserv, $dcmd</b><br />");
     $warnings++;      $warnings++;
  }   }
  if ($sdf eq 'S') { $unsend--; }   if ($sdf eq 'S') { $unsend--; }
Line 627  sub check_delayed_msg { Line 657  sub check_delayed_msg {
     }      }
   
     &log($fh,"<p>Total unsend messages: <b>$unsend</b></p>\n");      &log($fh,"<p>Total unsend messages: <b>$unsend</b></p>\n");
     $warnings=$warnings+5*$unsend;      if ($unsend > 0) {
           $warnings=$warnings+5*$unsend;
       }
   
     if ($unsend) { $simplestatus{'unsend'}=$unsend; }      if ($unsend) { $simplestatus{'unsend'}=$unsend; }
     &log($fh,"<h3>Outgoing Buffer</h3>\n<pre>");      &log($fh,"<h3>Outgoing Buffer</h3>\n<pre>");
Line 641  sub check_delayed_msg { Line 673  sub check_delayed_msg {
     }      }
     &log($fh,"</pre>\n");      &log($fh,"</pre>\n");
     close (DFH);      close (DFH);
       my %hostname = &Apache::lonnet::all_hostnames();
       my $numhosts = scalar(keys(%hostname));
 # pong to all servers that have delayed messages  # pong to all servers that have delayed messages
 # this will trigger a reverse connection, which should flush the buffers  # this will trigger a reverse connection, which should flush the buffers
     foreach my $tryserver (keys %servers) {      foreach my $tryserver (sort(keys(%servers))) {
         my $answer;          if ($hostname{$tryserver} || !$numhosts) {
         eval {              my $answer;
             local $SIG{ ALRM } = sub { die "TIMEOUT" };              eval {
             alarm(20);                  local $SIG{ ALRM } = sub { die "TIMEOUT" };
             $answer = &Apache::lonnet::reply("pong",$tryserver);                  alarm(20);
             alarm(0);                  $answer = &Apache::lonnet::reply("pong",$tryserver);
         };                  alarm(0);
         if ($@ && $@ =~ m/TIMEOUT/) {              };
             print "time out while contacting: $tryserver for pong\n";              if ($@ && $@ =~ m/TIMEOUT/) {
                   &log($fh,"Attempted pong to $tryserver timed out<br />");
                   print "Time out while contacting: $tryserver for pong.\n";
               } else {
                   &log($fh,"Pong to $tryserver: $answer<br />");
               }
         } else {          } else {
             &log($fh,"Pong to $tryserver: $answer<br />");              &log($fh,"$tryserver has delayed messages, but is not part of the cluster -- skipping 'Pong'.<br />");
         }          }
     }      }
 }  }
Line 668  sub finish_logging { Line 707  sub finish_logging {
     my $now=time;      my $now=time;
     my $date=localtime($now);      my $date=localtime($now);
     &log($fh,"<hr />$date ($now)</body></html>\n");      &log($fh,"<hr />$date ($now)</body></html>\n");
     print "lon-status webpage updated\n";      print "lon-status webpage updated.\n";
     $fh->close();      $fh->close();
   
     if ($errors) { $simplestatus{'errors'}=$errors; }      if ($errors) { $simplestatus{'errors'}=$errors; }
Line 689  sub log_simplestatus { Line 728  sub log_simplestatus {
 }  }
   
 sub write_loncaparevs {  sub write_loncaparevs {
     print "Retrieving LON-CAPA version information\n";      print "Retrieving LON-CAPA version information.\n";
     if (open(my $fh,">$perlvar{'lonTabDir'}/loncaparevs.tab")) {      my %hostname = &Apache::lonnet::all_hostnames();
         my %hostname = &Apache::lonnet::all_hostnames();      my $output;
         foreach my $id (sort(keys(%hostname))) {      foreach my $id (sort(keys(%hostname))) {
             if ($id ne '') {          if ($id ne '') {
                 my $loncaparev;              my $loncaparev;
               eval {
                   local $SIG{ ALRM } = sub { die "TIMEOUT" };
                   alarm(10);
                   $loncaparev =
                       &Apache::lonnet::get_server_loncaparev('',$id,1,'loncron');
                   alarm(0);
               };
               if ($@ && $@ =~ m/TIMEOUT/) {
                   print "Time out while contacting lonHost: $id for version.\n";   
               }
               if ($loncaparev =~ /^[\w.\-]+$/) {
                   $output .= $id.':'.$loncaparev."\n";
               }
           }
       }
       if ($output) {
           if (open(my $fh,">$perlvar{'lonTabDir'}/loncaparevs.tab")) {
               print $fh $output;
               close($fh);
               &Apache::lonnet::load_loncaparevs();
           }
       }
       return;
   }
   
   sub write_serverhomeIDs {
       print "Retrieving LON-CAPA lonHostID information.\n";
       my %name_to_host = &Apache::lonnet::all_names();
       my $output;
       foreach my $name (sort(keys(%name_to_host))) {
           if ($name ne '') {
               if (ref($name_to_host{$name}) eq 'ARRAY') {
                   my $serverhomeID;
                 eval {                  eval {
                     local $SIG{ ALRM } = sub { die "TIMEOUT" };                      local $SIG{ ALRM } = sub { die "TIMEOUT" };
                     alarm(10);                      alarm(10);
                     $loncaparev =                      $serverhomeID = 
                         &Apache::lonnet::get_server_loncaparev('',$id,1,'loncron');                          &Apache::lonnet::get_server_homeID($name,1,'loncron');
                     alarm(0);                      alarm(0);
                 };                  };
                 if ($@ && $@ =~ m/TIMEOUT/) {                  if ($@ && $@ =~ m/TIMEOUT/) {
                     print "time out while contacting lonHost: $id for version\n";                         print "Time out while contacting server: $name\n"; 
                 }                  }
                 if ($loncaparev =~ /^[\w.\-]+$/) {                  if ($serverhomeID ne '') {
                     print $fh $id.':'.$loncaparev."\n";                      $output .= $name.':'.$serverhomeID."\n";
                   } else {
                       $output .= $name.':'.$name_to_host{$name}->[0]."\n";
                 }                  }
             }              }
         }          }
         close($fh);      }
       if ($output) {
           if (open(my $fh,">$perlvar{'lonTabDir'}/serverhomeIDs.tab")) {
               print $fh $output;
               close($fh);
               &Apache::lonnet::load_serverhomeIDs();
           }
     }      }
     return;      return;
 }  }
   
 sub write_serverhomeIDs {  sub write_checksums {
     print "Retrieving LON-CAPA lonHostID information\n";      my $distro = &LONCAPA::distro();
     if (open(my $fh,">$perlvar{'lonTabDir'}/serverhomeIDs.tab")) {      if ($distro) {
         my %name_to_host = &Apache::lonnet::all_names();          print "Retrieving file version and checksumming.\n";
         foreach my $name (sort(keys(%name_to_host))) {          my $numchksums = 0;
             if ($name ne '') {          my ($chksumsref,$versionsref) =
                 if (ref($name_to_host{$name}) eq 'ARRAY') {              &LONCAPA::Checksumming::get_checksums($distro,$perlvar{'lonDaemons'},
                     my $serverhomeID;                                                    $perlvar{'lonLib'},
                     eval {                                                    $perlvar{'lonIncludes'},
                         local $SIG{ ALRM } = sub { die "TIMEOUT" };                                                    $perlvar{'lonTabDir'});
                         alarm(10);          if (ref($chksumsref) eq 'HASH') {
                         $serverhomeID =               $numchksums = scalar(keys(%{$chksumsref}));
                             &Apache::lonnet::get_server_homeID($name,1,'loncron');  
                         alarm(0);  
                     };  
                     if ($@ && $@ =~ m/TIMEOUT/) {  
                         print "Time out while contacting server: $name\n";   
                     }  
                     if ($serverhomeID ne '') {  
                         print $fh $name.':'.$serverhomeID."\n";  
                     } else {  
                         print $fh $name.':'.$name_to_host{$name}->[0]."\n";  
                     }  
                 }  
             }  
         }          }
         close($fh);          print "File version retrieved and checksumming completed for $numchksums files.\n";
       } else {
           print "File version retrieval and checksumming skipped - could not determine Linux distro.\n"; 
     }      }
     return;      return;
 }  }
   
 sub send_mail {  sub send_mail {
     print "sending mail\n";  
     my $defdom = $perlvar{'lonDefDomain'};      my $defdom = $perlvar{'lonDefDomain'};
     my $origmail = $perlvar{'lonAdmEMail'};      my $origmail = $perlvar{'lonAdmEMail'};
     my $emailto = &Apache::loncommon::build_recipient_list(undef,      my $emailto = &Apache::loncommon::build_recipient_list(undef,
Line 755  sub send_mail { Line 823  sub send_mail {
     if ($totalcount>2500) {      if ($totalcount>2500) {
  $emailto.=",$perlvar{'lonSysEMail'}";   $emailto.=",$perlvar{'lonSysEMail'}";
     }      }
     my $subj="LON: $perlvar{'lonHostID'} E:$errors W:$warnings N:$notices";       my $from;
       my $hostname=`/bin/hostname`;
     my $result=system("metasend -b -S 4000000 -t $emailto -s '$subj' -f $statusdir/index.html -m text/html >& /dev/null");      chop($hostname);
     if ($result != 0) {      $hostname=~s/[^\w\.]//g;
  $result=system("mail -s '$subj' $emailto < $statusdir/index.html");      if ($hostname) {
           $from = 'www@'.$hostname;
       }
       my $subj="LON: $perlvar{'lonHostID'} E:$errors W:$warnings N:$notices";
       my $loncronmail = "To: $emailto\n".
                         "From: $from\n".
                         "Subject: ".$subj."\n".
                         "Content-type: text/html\; charset=UTF-8\n".
                         "MIME-Version: 1.0\n\n";
       if (open(my $fh,"<$statusdir/index.html")) {
           while (<$fh>) {
               $loncronmail .= $_;
           }
           close($fh);
       } else {
           $loncronmail .= "Failed to read from http://$hostname/lon-status/index.html\n";
       }
       $loncronmail .= "\n\n";
       if (open(my $mailh, "|/usr/lib/sendmail -oi -t -odb")) {
           print $mailh $loncronmail;
           close($mailh);
           print "Sending mail.\n";
       } else {
           print "Sending mail failed.\n";
     }      }
 }  }
   
 sub usage {  sub usage {
     print(<<USAGE);      print(<<USAGE);
 loncron - housekeeping program that checks up on various parts of Lon-CAPA  loncron - housekeeping program that checks up on various parts of LON-CAPA
   
 Options:  Options:
    --help     Display      --help     Display 
Line 821  sub main () { Line 912  sub main () {
 # ----------------------------- Make sure this process is running from user=www  # ----------------------------- Make sure this process is running from user=www
     my $wwwid=getpwnam('www');      my $wwwid=getpwnam('www');
     if ($wwwid!=$<) {      if ($wwwid!=$<) {
  print("User ID mismatch.  This program must be run as user 'www'\n");   print("User ID mismatch. This program must be run as user 'www'.\n");
  my $emailto="$perlvar{'lonAdmEMail'},$perlvar{'lonSysEMail'}";   my $emailto="$perlvar{'lonAdmEMail'},$perlvar{'lonSysEMail'}";
  my $subj="LON: $perlvar{'lonHostID'} User ID mismatch";   my $subj="LON: $perlvar{'lonHostID'} User ID mismatch";
  system("echo 'User ID mismatch.  loncron must be run as user www.' |\   system("echo 'User ID mismatch. loncron must be run as user www.' |\
  mailto $emailto -s '$subj' > /dev/null");   mailto $emailto -s '$subj' > /dev/null");
  exit 1;   exit 1;
     }      }
   
 # -------------------------------------------- Force reload of host information  # -------------------------------------------- Force reload of host information
     &Apache::lonnet::load_hosts_tab(1);      my $nomemcache;
     &Apache::lonnet::load_domain_tab(1);      if ($justcheckdaemons) {
     &Apache::lonnet::get_iphost(1);          $nomemcache=1;
           my $memcachepidfile="$perlvar{'lonDaemons'}/logs/memcached.pid";
           my $memcachepid;
           if (-e $memcachepidfile) {
               my $memfh=IO::File->new($memcachepidfile);
               $memcachepid=<$memfh>;
               chomp($memcachepid);
               if ($memcachepid =~ /^\d+$/ && kill 0 => $memcachepid) {
                   undef($nomemcache);
               }
           }
       }
       &Apache::lonnet::load_hosts_tab(1,$nomemcache);
       &Apache::lonnet::load_domain_tab(1,$nomemcache);
       &Apache::lonnet::get_iphost(1,$nomemcache);
   
 # ----------------------------------------- Force firewall update for lond port    # ----------------------------------------- Force firewall update for lond port  
   
Line 869  sub main () { Line 974  sub main () {
  &log_machine_info($fh);   &log_machine_info($fh);
  &clean_tmp($fh);   &clean_tmp($fh);
  &clean_lonIDs($fh);   &clean_lonIDs($fh);
           &clean_webDAV_sessionIDs($fh);
  &check_httpd_logs($fh);   &check_httpd_logs($fh);
  &rotate_lonnet_logs($fh);   &rotate_lonnet_logs($fh);
  &rotate_other_logs($fh);   &rotate_other_logs($fh);
Line 896  sub main () { Line 1002  sub main () {
  &log_simplestatus();   &log_simplestatus();
         &write_loncaparevs();          &write_loncaparevs();
         &write_serverhomeIDs();          &write_serverhomeIDs();
    &write_checksums();
  if ($totalcount>200 && !$noemail) { &send_mail(); }   if ($totalcount>200 && !$noemail) { &send_mail(); }
     }      }
 }  }
Line 904  sub main () { Line 1010  sub main () {
 &main();  &main();
 1;  1;
   
   
   
   
   
   
   
   

Removed from v.1.93  
changed lines
  Added in v.1.103


FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>