Task 16071635

Name	hadcm3n_4ls0_1980_40_008402058_1
Workunit	8552914
Created	21 Oct 2013, 22:52:46 UTC
Sent	21 Oct 2013, 22:52:50 UTC
Report deadline	21 Jan 2014, 6:20:01 UTC
Received	31 Oct 2013, 13:47:35 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1283613
Run time	8 days 12 hours 20 min 38 sec
CPU time	8 days 8 hours 9 min 11 sec
Validate state	Invalid
Credit	9,020.16
Device peak FLOPS	4.20 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> 裝置無法辨識命令。 (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:15:16 (3944): No heartbeat from core client for 30 sec - exiting 08:15:17 (3944): No heartbeat from core client for 30 sec - exiting 08:15:18 (3944): No heartbeat from core client for 30 sec - exiting 08:15:19 (3944): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 06:50:40 (5432): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:35:58 (4072): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:35:59 (4072): No heartbeat from core client for 30 sec - exiting 10:27:37 (3816): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 10:27:44 (3336): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:29:03 (4796): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4856, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4856, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3300, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 21:41:07 (3064): No heartbeat from core client for 30 sec - exiting 21:41:10 (3064): No heartbeat from core client for 30 sec - exiting 21:41:11 (3064): No heartbeat from core client for 30 sec - exiting 21:41:12 (3064): No heartbeat from core client for 30 sec - exiting 21:41:13 (3064): No heartbeat from core client for 30 sec - exiting 21:41:15 (3064): No heartbeat from core client for 30 sec - exiting 21:41:16 (3064): No heartbeat from core client for 30 sec - exiting 21:41:18 (3064): No heartbeat from core client for 30 sec - exiting 21:41:19 (3064): No heartbeat from core client for 30 sec - exiting 21:41:21 (3064): No heartbeat from core client for 30 sec - exiting 21:41:22 (3064): No heartbeat from core client for 30 sec - exiting 21:41:23 (3064): No heartbeat from core client for 30 sec - exiting 21:41:24 (3064): No heartbeat from core client for 30 sec - exiting 21:41:25 (3064): No heartbeat from core client for 30 sec - exiting 21:41:26 (3064): No heartbeat from core client for 30 sec - exiting 21:41:27 (3064): No heartbeat from core client for 30 sec - exiting 21:41:28 (3064): No heartbeat from core client for 30 sec - exiting 21:41:29 (3064): No heartbeat from core client for 30 sec - exiting 21:41:31 (3064): No heartbeat from core client for 30 sec - exiting 21:41:32 (3064): No heartbeat from core client for 30 sec - exiting 21:41:33 (3064): No heartbeat from core client for 30 sec - exiting 21:41:34 (3064): No heartbeat from core client for 30 sec - exiting 21:41:35 (3064): No heartbeat from core client for 30 sec - exiting 21:41:36 (3064): No heartbeat from core client for 30 sec - exiting 21:41:37 (3064): No heartbeat from core client for 30 sec - exiting 21:41:38 (3064): No heartbeat from core client for 30 sec - exiting 21:41:39 (3064): No heartbeat from core client for 30 sec - exiting 21:41:40 (3064): No heartbeat from core client for 30 sec - exiting Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3840, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2924, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2924, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
31 Oct 2013 08:54:12	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	751,680	704,769	0.9376
31 Oct 2013 02:17:01	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	725,760	681,089	0.9384
30 Oct 2013 20:44:13	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	699,840	657,758	0.9399
30 Oct 2013 13:09:15	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	673,920	634,154	0.9410
30 Oct 2013 05:06:21	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	648,000	609,386	0.9404
29 Oct 2013 17:36:08	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	622,080	584,689	0.9399
29 Oct 2013 08:57:58	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	596,160	561,344	0.9416
28 Oct 2013 23:08:25	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	570,240	537,802	0.9431
28 Oct 2013 16:16:54	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	544,320	514,236	0.9447
28 Oct 2013 07:55:17	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	518,400	489,918	0.9451
28 Oct 2013 01:07:13	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	492,480	465,899	0.9460
27 Oct 2013 18:22:02	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	466,560	441,869	0.9471
27 Oct 2013 11:29:36	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	440,640	417,358	0.9472
27 Oct 2013 04:31:49	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	414,720	392,325	0.9460
26 Oct 2013 21:18:50	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	388,800	367,256	0.9446
26 Oct 2013 14:19:14	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	362,880	342,237	0.9431
26 Oct 2013 06:20:54	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	336,960	317,782	0.9431
25 Oct 2013 23:32:48	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	311,040	293,714	0.9443
25 Oct 2013 16:48:35	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	285,120	269,792	0.9462
25 Oct 2013 09:38:51	1283613	16071635	hadcm3n_4ls0_1980_40_008402058_1	259,200	245,352	0.9466