Task 15445097

Name	hadcm3n_zj9m_1880_40_008247622_1
Workunit	8402746
Created	21 Nov 2012, 8:48:34 UTC
Sent	21 Nov 2012, 8:48:43 UTC
Report deadline	20 Feb 2013, 16:15:54 UTC
Received	23 Feb 2013, 22:14:51 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1027597
Run time	16 days 14 hours 59 min 55 sec
CPU time	15 days 19 hours 21 min
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	2.87 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2968, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2968, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 10:28:00 (2272): No heartbeat from core client for 30 sec - exiting 10:28:01 (2272): No heartbeat from core client for 30 sec - exiting 10:28:02 (2272): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:28:03 (2272): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... C17:22:12 (4472): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3364, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4880, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2504, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4664, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4296, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2812, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2812, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4220, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4012, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4728, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3228, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3228, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... 08:31:20 (3640): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:11:32 (4084): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1440, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3436, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
23 Feb 2013 22:15:52	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	1,036,800	1,365,659	1.3172
23 Feb 2013 12:45:07	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	1,010,880	1,332,477	1.3181
22 Feb 2013 11:12:28	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	984,960	1,299,495	1.3193
20 Feb 2013 21:31:39	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	959,040	1,266,318	1.3204
19 Feb 2013 20:39:08	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	933,120	1,233,463	1.3219
18 Feb 2013 20:03:09	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	907,200	1,200,214	1.3230
17 Feb 2013 19:03:41	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	881,280	1,166,264	1.3234
17 Feb 2013 09:12:03	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	855,360	1,132,470	1.3240
16 Feb 2013 00:22:08	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	829,440	1,098,571	1.3245
14 Feb 2013 21:24:04	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	803,520	1,064,097	1.3243
12 Feb 2013 21:58:56	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	777,600	1,030,040	1.3246
11 Feb 2013 19:43:27	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	751,680	995,597	1.3245
09 Feb 2013 11:07:24	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	725,760	961,813	1.3252
05 Feb 2013 19:58:17	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	699,840	927,527	1.3253
02 Feb 2013 11:26:12	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	673,920	893,352	1.3256
31 Jan 2013 18:16:35	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	648,000	859,320	1.3261
29 Jan 2013 14:20:22	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	622,080	824,906	1.3260
24 Jan 2013 15:50:41	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	596,160	790,366	1.3258
23 Jan 2013 20:42:12	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	570,240	755,855	1.3255
23 Jan 2013 10:33:31	1027597	15445097	hadcm3n_zj9m_1880_40_008247622_1	544,320	721,687	1.3259