Task 13132868

Name	hadcm3n_yk4e_1900_40_007358936_2
Workunit	7556366
Created	8 Jul 2011, 4:22:42 UTC
Sent	8 Jul 2011, 4:32:36 UTC
Report deadline	7 Oct 2011, 11:59:47 UTC
Received	7 Aug 2011, 12:32:25 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1026912
Run time	9 days 11 hours 55 min 15 sec
CPU time	8 days 20 hours 47 min 32 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	2.77 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3712, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 05:05:02 (9560): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4116, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4080, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3964, iMonCtr=1 Model crash detected, will try to restart... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Aug 2011 08:53:14	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	596,160	786,935	1.3200
06 Aug 2011 21:15:00	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	570,240	751,724	1.3183
06 Aug 2011 10:36:12	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	544,320	717,474	1.3181
06 Aug 2011 00:12:00	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	518,400	683,138	1.3178
05 Aug 2011 14:28:01	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	492,480	648,995	1.3178
04 Aug 2011 09:11:40	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	466,560	615,127	1.3184
03 Aug 2011 23:03:06	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	440,640	580,588	1.3176
03 Aug 2011 13:12:04	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	414,720	546,294	1.3173
03 Aug 2011 01:41:50	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	388,800	512,320	1.3177
02 Aug 2011 16:00:14	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	362,880	478,409	1.3184
02 Aug 2011 05:15:13	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	336,960	444,017	1.3177
01 Aug 2011 18:50:29	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	311,040	409,522	1.3166
01 Aug 2011 08:57:44	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	285,120	375,434	1.3168
31 Jul 2011 17:56:01	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	259,200	341,554	1.3177
31 Jul 2011 07:15:57	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	233,280	306,769	1.3150
30 Jul 2011 20:35:46	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	207,360	272,007	1.3118
30 Jul 2011 08:19:04	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	181,440	238,298	1.3134
29 Jul 2011 00:48:41	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	155,520	204,331	1.3139
28 Jul 2011 14:12:30	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	129,600	170,639	1.3167
27 Jul 2011 22:36:32	1026912	13132868	hadcm3n_yk4e_1900_40_007358936_2	103,680	136,416	1.3157