Task 16200628

Name	hadcm3n_ob7n_1900_40_008469654_2
Workunit	8620493
Created	2 Jan 2014, 19:58:41 UTC
Sent	2 Jan 2014, 19:58:47 UTC
Report deadline	4 Apr 2014, 3:25:58 UTC
Received	24 Jan 2014, 12:29:32 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1319477
Run time	17 days 21 hours 44 min 57 sec
CPU time	15 days 15 hours 33 min 33 sec
Validate state	Invalid
Credit	9,020.16
Device peak FLOPS	2.22 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 02:32:00 (4092): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:31:15 (6176): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:54:25 (3664): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4976, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 02:16:50 (2364): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 20:22:07 (5516): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:05:48 (3500): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 01:51:11 (5048): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 01:58:08 (3888): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:51:20 (5316): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:59:54 (276): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4012, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4012, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
24 Jan 2014 12:32:23	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	751,680	1,317,775	1.7531
23 Jan 2014 01:03:47	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	725,760	1,272,548	1.7534
22 Jan 2014 10:18:43	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	699,840	1,226,688	1.7528
21 Jan 2014 20:00:44	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	673,920	1,180,936	1.7523
21 Jan 2014 05:19:14	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	648,000	1,135,227	1.7519
20 Jan 2014 14:51:51	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	622,080	1,089,703	1.7517
20 Jan 2014 00:33:35	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	596,160	1,044,377	1.7518
19 Jan 2014 09:45:22	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	570,240	998,927	1.7518
18 Jan 2014 19:11:53	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	544,320	953,763	1.7522
18 Jan 2014 03:20:51	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	518,400	908,565	1.7526
17 Jan 2014 12:53:02	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	492,480	863,027	1.7524
16 Jan 2014 22:49:32	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	466,560	818,012	1.7533
16 Jan 2014 08:18:23	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	440,640	772,601	1.7534
15 Jan 2014 18:04:19	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	414,720	727,604	1.7544
15 Jan 2014 03:52:41	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	388,800	682,234	1.7547
14 Jan 2014 12:49:15	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	362,880	636,931	1.7552
14 Jan 2014 00:40:58	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	336,960	591,184	1.7545
13 Jan 2014 06:52:25	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	311,040	545,602	1.7541
12 Jan 2014 15:35:25	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	285,120	500,215	1.7544
12 Jan 2014 01:46:48	1306645	16200628	hadcm3n_ob7n_1900_40_008469654_2	259,200	455,329	1.7567