Task 16290041

Name	hadcm3n_4fga_2020_40_008409256_2
Workunit	8560112
Created	11 Feb 2014, 22:11:29 UTC
Sent	11 Feb 2014, 22:11:31 UTC
Report deadline	14 May 2014, 5:38:42 UTC
Received	3 Apr 2014, 1:08:08 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1191292
Run time	15 days 9 hours 12 min 24 sec
CPU time	5 days 23 hours 49 min 32 sec
Validate state	Invalid
Credit	12,130.56
Device peak FLOPS	3.82 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 14:11:25 (2072): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 16:57:23 (964): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:30:05 (676): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1484, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1484, iMonCtr=1 Model crash detected, will try to restart... 03:05:55 (5668): Can't acquire lockfile (32) - waiting 35s Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2408, selfPID=2408, iMonCtr=1 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5668, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5668, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5668, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Apr 2014 19:50:48	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	1,010,880	1,262,924	1.2493
02 Apr 2014 10:37:27	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	984,960	1,230,724	1.2495
02 Apr 2014 01:15:35	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	959,040	1,198,470	1.2497
01 Apr 2014 16:01:33	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	933,120	1,166,216	1.2498
01 Apr 2014 06:45:32	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	907,200	1,133,939	1.2499
01 Apr 2014 01:54:21	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	881,280	1,101,751	1.2502
31 Mar 2014 12:14:06	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	855,360	1,069,483	1.2503
31 Mar 2014 02:56:19	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	829,440	1,037,314	1.2506
30 Mar 2014 18:02:40	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	803,520	1,006,314	1.2524
30 Mar 2014 07:36:48	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	777,600	977,069	1.2565
29 Mar 2014 20:39:52	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	751,680	947,868	1.2610
29 Mar 2014 11:51:30	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	725,760	917,569	1.2643
29 Mar 2014 02:34:52	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	699,840	885,276	1.2650
28 Mar 2014 17:31:26	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	673,920	852,948	1.2657
27 Mar 2014 21:46:19	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	648,000	820,350	1.2660
27 Mar 2014 12:19:47	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	622,080	787,677	1.2662
27 Mar 2014 00:53:04	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	596,160	754,993	1.2664
26 Mar 2014 13:20:50	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	570,240	722,285	1.2666
26 Mar 2014 01:49:12	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	544,320	689,716	1.2671
25 Mar 2014 15:27:04	1191292	16290041	hadcm3n_4fga_2020_40_008409256_2	518,400	657,020	1.2674