Task 16102213

Name	hadcm3n_82j8_1980_40_008461223_1
Workunit	8612079
Created	2 Dec 2013, 18:52:53 UTC
Sent	2 Dec 2013, 18:52:58 UTC
Report deadline	4 Mar 2014, 2:20:09 UTC
Received	13 Dec 2013, 13:07:16 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	995357
Run time	5 days 3 hours 25 min 53 sec
CPU time	4 days 20 hours 22 min 55 sec
Validate state	Invalid
Credit	3,732.48
Device peak FLOPS	2.87 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.60</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 12:47:19 (1784): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:23:22 (436): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:40:45 (1312): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:04:07 (3020): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1868, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1868, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1868, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1868, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1868, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1868, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
12 Dec 2013 14:03:00	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	311,040	402,644	1.2945
11 Dec 2013 20:23:41	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	285,120	369,439	1.2957
11 Dec 2013 07:12:38	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	259,200	336,227	1.2972
09 Dec 2013 19:56:52	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	233,280	303,191	1.2997
09 Dec 2013 06:53:55	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	207,360	269,727	1.3008
08 Dec 2013 18:22:50	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	181,440	236,357	1.3027
08 Dec 2013 07:19:14	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	155,520	203,360	1.3076
07 Dec 2013 14:54:14	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	129,600	170,199	1.3133
07 Dec 2013 01:38:19	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	103,680	136,394	1.3155
06 Dec 2013 07:17:10	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	77,760	102,769	1.3216
05 Dec 2013 17:09:42	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	51,840	68,467	1.3207
05 Dec 2013 03:41:04	995357	16102213	hadcm3n_82j8_1980_40_008461223_1	25,920	34,056	1.3139