Task 14644799

Name	hadcm3n_u3p0_1980_40_007956421_0
Workunit	8111533
Created	9 May 2012, 1:58:32 UTC
Sent	9 May 2012, 2:06:24 UTC
Report deadline	8 Aug 2012, 9:33:35 UTC
Received	20 Jun 2012, 2:32:49 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1393537
Run time	35 days 0 hours 3 min 37 sec
CPU time	34 days 9 hours 30 min 19 sec
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	1.73 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.25</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4788, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5756, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 17:07:08 (6040): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2780, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6036, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4656, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:01:00 (2712): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4564, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6380, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1216, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=964, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4132, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5760, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4788, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Jun 2012 02:36:54	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	1,036,800	2,971,816	2.8663
19 Jun 2012 06:24:11	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	1,010,880	2,900,312	2.8691
17 Jun 2012 07:58:36	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	984,960	2,829,779	2.8730
16 Jun 2012 01:02:06	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	959,040	2,755,974	2.8737
14 Jun 2012 03:46:58	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	933,120	2,682,281	2.8745
10 Jun 2012 04:28:25	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	907,200	2,608,488	2.8753
09 Jun 2012 03:10:33	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	881,280	2,534,503	2.8759
08 Jun 2012 00:39:45	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	855,360	2,459,947	2.8759
07 Jun 2012 02:42:38	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	829,440	2,385,082	2.8755
06 Jun 2012 06:12:37	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	803,520	2,310,366	2.8753
05 Jun 2012 09:07:17	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	777,600	2,236,004	2.8755
04 Jun 2012 11:43:56	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	751,680	2,161,126	2.8751
03 Jun 2012 11:46:44	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	725,760	2,086,180	2.8745
02 Jun 2012 12:02:03	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	699,840	2,011,285	2.8739
01 Jun 2012 04:57:02	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	673,920	1,936,359	2.8733
31 May 2012 06:22:03	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	648,000	1,862,358	2.8740
30 May 2012 09:19:52	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	622,080	1,788,298	2.8747
29 May 2012 11:38:06	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	596,160	1,713,230	2.8738
28 May 2012 14:31:42	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	570,240	1,638,570	2.8735
27 May 2012 16:11:01	1111761	14644799	hadcm3n_u3p0_1980_40_007956421_0	544,320	1,562,961	2.8714