Task 15449454

Name	hadcm3n_z9mz_1880_40_008249492_0
Workunit	8404616
Created	21 Nov 2012, 23:19:28 UTC
Sent	21 Nov 2012, 23:19:36 UTC
Report deadline	21 Feb 2013, 6:46:47 UTC
Received	18 Jan 2013, 10:07:07 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1183690
Run time	19 days 22 hours 0 min 53 sec
CPU time	17 days 15 hours 17 min 39 sec
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	2.71 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 03:19:00 (5084): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:51:49 (3912): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 16:35:31 (4192): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1524, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4328, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4636, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5044, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5720, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5004, iMonCtr=1 Model crash detected, will try to restart... 00:04:07 (4472): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4420, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=484, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4152, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5288, iMonCtr=1 Model crash detected, will try to restart... 13:12:15 (4264): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 00:22:12 (5844): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Jan 2013 10:10:37	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	1,036,800	1,523,857	1.4698
17 Jan 2013 13:10:44	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	1,010,880	1,487,735	1.4717
16 Jan 2013 16:26:23	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	984,960	1,451,960	1.4741
16 Jan 2013 07:02:11	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	959,040	1,416,314	1.4768
15 Jan 2013 09:58:51	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	933,120	1,380,535	1.4795
14 Jan 2013 14:05:37	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	907,200	1,344,542	1.4821
14 Jan 2013 02:27:11	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	881,280	1,305,395	1.4812
12 Jan 2013 13:45:16	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	855,360	1,264,898	1.4788
11 Jan 2013 11:54:50	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	829,440	1,224,797	1.4767
10 Jan 2013 11:34:09	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	803,520	1,184,995	1.4748
09 Jan 2013 13:25:15	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	777,600	1,146,826	1.4748
08 Jan 2013 15:40:52	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	751,680	1,110,643	1.4775
08 Jan 2013 06:16:29	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	725,760	1,074,531	1.4806
07 Jan 2013 09:51:16	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	699,840	1,038,378	1.4837
07 Jan 2013 00:24:13	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	673,920	1,002,329	1.4873
04 Jan 2013 17:32:35	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	648,000	966,078	1.4909
04 Jan 2013 07:24:58	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	622,080	929,968	1.4949
03 Jan 2013 10:21:17	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	596,160	892,738	1.4975
02 Jan 2013 11:50:01	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	570,240	853,193	1.4962
29 Dec 2012 21:36:07	1183690	15449454	hadcm3n_z9mz_1880_40_008249492_0	544,320	813,974	1.4954