Task 12789525

Name	hadcm3n_o1jp_1900_40_007197336_2
Workunit	7395616
Created	9 Apr 2011, 12:59:08 UTC
Sent	9 Apr 2011, 12:59:33 UTC
Report deadline	9 Jul 2011, 20:26:44 UTC
Received	25 Apr 2011, 21:10:32 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1123123
Run time	16 days 3 hours 15 min 53 sec
CPU time	16 days 2 hours 30 min 37 sec
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	2.66 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 19:38:16 (2124): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2616, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2616, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2616, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2616, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2616, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2616, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
27 Apr 2011 17:40:50	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	1,036,800	1,505,063	1.4516
27 Apr 2011 06:47:23	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	1,010,880	1,466,047	1.4503
26 Apr 2011 19:34:40	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	984,960	1,426,992	1.4488
25 Apr 2011 17:30:13	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	959,040	1,388,459	1.4478
25 Apr 2011 05:48:24	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	933,120	1,348,514	1.4452
24 Apr 2011 18:43:30	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	907,200	1,308,523	1.4424
24 Apr 2011 07:32:37	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	881,280	1,268,612	1.4395
23 Apr 2011 20:28:05	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	855,360	1,228,738	1.4365
23 Apr 2011 09:18:27	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	829,440	1,188,852	1.4333
22 Apr 2011 22:22:55	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	803,520	1,149,567	1.4307
22 Apr 2011 11:37:14	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	777,600	1,110,816	1.4285
22 Apr 2011 01:03:14	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	751,680	1,072,856	1.4273
21 Apr 2011 14:37:22	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	725,760	1,035,639	1.4270
21 Apr 2011 04:11:31	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	699,840	998,165	1.4263
20 Apr 2011 21:12:10	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	673,920	961,307	1.4264
20 Apr 2011 21:12:10	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	648,000	924,602	1.4269
20 Apr 2011 21:12:10	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	622,080	887,794	1.4271
20 Apr 2011 21:12:10	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	596,160	850,881	1.4273
20 Apr 2011 21:12:10	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	570,240	814,017	1.4275
20 Apr 2011 21:12:10	1123123	12789525	hadcm3n_o1jp_1900_40_007197336_2	544,320	776,972	1.4274