Task 15596264

Name	hadcm3n_49fi_1940_40_008309237_0
Workunit	8460372
Created	7 Feb 2013, 20:22:38 UTC
Sent	7 Feb 2013, 20:28:21 UTC
Report deadline	10 May 2013, 3:55:32 UTC
Received	11 Mar 2013, 16:01:09 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	895093
Run time	15 days 0 hours 36 min 57 sec
CPU time	14 days 7 hours 16 min 13 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	3.22 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 02:21:52 (3532): No heartbeat from core client for 30 sec - exiting 02:21:53 (3532): No heartbeat from core client for 30 sec - exiting 02:21:54 (3532): No heartbeat from core client for 30 sec - exiting 02:21:55 (3532): No heartbeat from core client for 30 sec - exiting 02:21:56 (3532): No heartbeat from core client for 30 sec - exiting 02:21:57 (3532): No heartbeat from core client for 30 sec - exiting 02:21:58 (3532): No heartbeat from core client for 30 sec - exiting 02:21:59 (3532): No heartbeat from core client for 30 sec - exiting 02:22:00 (3532): No heartbeat from core client for 30 sec - exiting 02:22:01 (3532): No heartbeat from core client for 30 sec - exiting 02:22:02 (3532): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4820, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1900, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1900, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1900, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1900, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1900, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1900, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 Mar 2013 10:41:51	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	440,640	1,179,377	2.6765
09 Mar 2013 12:23:06	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	414,720	1,102,252	2.6578
08 Mar 2013 15:05:31	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	388,800	1,028,243	2.6447
07 Mar 2013 20:40:43	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	362,880	965,122	2.6596
07 Mar 2013 02:13:03	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	336,960	902,810	2.6793
06 Mar 2013 07:45:35	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	311,040	837,768	2.6934
05 Mar 2013 13:15:04	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	285,120	772,907	2.7108
04 Mar 2013 19:38:31	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	259,200	708,255	2.7325
03 Mar 2013 08:35:53	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	233,280	630,882	2.7044
02 Mar 2013 10:49:06	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	207,360	558,489	2.6933
01 Mar 2013 05:36:43	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	181,440	484,638	2.6711
28 Feb 2013 09:17:53	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	155,520	414,553	2.6656
27 Feb 2013 14:20:23	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	129,600	348,184	2.6866
26 Feb 2013 16:41:05	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	103,680	271,589	2.6195
25 Feb 2013 14:21:36	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	77,760	200,053	2.5727
24 Feb 2013 17:12:05	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	51,840	132,588	2.5576
23 Feb 2013 21:09:40	895093	15596264	hadcm3n_49fi_1940_40_008309237_0	25,920	67,432	2.6015