Task 13649722

Name	hadcm3n_ydw9_1900_40_007518343_2
Workunit	7715818
Created	20 Nov 2011, 23:32:52 UTC
Sent	20 Nov 2011, 23:45:03 UTC
Report deadline	20 Feb 2012, 7:12:14 UTC
Received	19 Dec 2011, 12:28:32 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1155124
Run time	7 days 22 hours 30 min 47 sec
CPU time	7 days 18 hours 50 min 12 sec
Validate state	Invalid
Credit	4,043.52
Device peak FLOPS	2.27 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:58:01 (288): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:58:09 (288): No heartbeat from core client for 30 sec - exiting 14:58:11 (288): No heartbeat from core client for 30 sec - exiting 14:58:12 (288): No heartbeat from core client for 30 sec - exiting 14:58:13 (288): No heartbeat from core client for 30 sec - exiting 14:58:14 (288): No heartbeat from core client for 30 sec - exiting 14:58:15 (288): No heartbeat from core client for 30 sec - exiting Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4540, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4540, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4540, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4540, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
29 Nov 2011 11:41:12	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	336,960	650,450	1.9303
28 Nov 2011 17:58:06	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	311,040	600,238	1.9298
28 Nov 2011 01:48:29	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	285,120	549,909	1.9287
27 Nov 2011 09:25:53	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	259,200	499,401	1.9267
26 Nov 2011 16:56:33	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	233,280	449,134	1.9253
26 Nov 2011 00:52:35	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	207,360	399,179	1.9251
25 Nov 2011 10:26:23	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	181,440	349,068	1.9239
24 Nov 2011 16:48:43	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	155,520	299,005	1.9226
24 Nov 2011 01:59:48	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	129,600	249,006	1.9213
23 Nov 2011 09:43:16	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	103,680	198,632	1.9158
22 Nov 2011 19:23:19	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	77,760	148,531	1.9101
22 Nov 2011 05:32:59	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	51,840	99,045	1.9106
21 Nov 2011 15:40:18	1155124	13649722	hadcm3n_ydw9_1900_40_007518343_2	25,920	49,547	1.9115