Task 15442474

Name	hadcm3n_zc5f_1880_40_008246475_1
Workunit	8401599
Created	21 Nov 2012, 1:34:45 UTC
Sent	21 Nov 2012, 1:34:57 UTC
Report deadline	20 Feb 2013, 9:02:08 UTC
Received	17 Dec 2012, 2:48:45 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1149107
Run time	5 days 1 hours 33 min 3 sec
CPU time	4 days 19 hours 2 min 31 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	4.23 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4948, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4920, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3848, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3960, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4516, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4644, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4456, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:14:14 (5048): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4600, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4600, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4600, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4600, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5000, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4828, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
15 Dec 2012 21:36:49	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	440,640	398,774	0.9050
15 Dec 2012 00:31:49	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	414,720	374,170	0.9022
14 Dec 2012 02:34:29	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	388,800	349,435	0.8988
14 Dec 2012 02:34:29	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	362,880	325,509	0.8970
14 Dec 2012 02:34:29	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	336,960	300,989	0.8932
14 Dec 2012 02:34:29	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	311,040	275,559	0.8859
07 Dec 2012 02:30:57	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	285,120	252,108	0.8842
05 Dec 2012 13:30:31	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	259,200	228,677	0.8822
04 Dec 2012 04:36:21	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	233,280	205,760	0.8820
03 Dec 2012 00:27:44	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	207,360	183,083	0.8829
02 Dec 2012 04:27:49	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	181,440	160,474	0.8844
01 Dec 2012 18:30:13	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	155,520	137,797	0.8860
29 Nov 2012 13:23:34	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	129,600	114,735	0.8853
29 Nov 2012 00:10:39	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	103,680	91,295	0.8805
26 Nov 2012 03:24:00	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	77,760	68,802	0.8848
24 Nov 2012 15:14:46	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	51,840	46,767	0.9021
23 Nov 2012 00:58:49	1149107	15442474	hadcm3n_zc5f_1880_40_008246475_1	25,920	23,802	0.9183