This looks like a basic TCP/IP connection issue.  It could be related to a number of things.  One thing to keep in mind is the direction of the connections.  The controller need to start first - it listens on a port and then the engines connect to it.  The host that the controller is on needs to allow incoming TCP/IP connections.  The hosts with the engine need to allow outgoing connections.<br>
<br>Have a look at the following:<br><br>* Firewall.  If a fire wall is blocking the engine from connecting to the controller you will see this type of error.  A fire wall like this would be unusual though (I have never seen one before).  To test this, start the controller on the head node, ssh to a compute node and then just telnet (it will fail) to the controller.  But you should see the connection start to happen.  You could also run ipengine by hand on the compute node.<br>
* If the controller hasn&#39;t been started or failed to start, you would also see this.  Look at the controller logs to see if this is going on.<br>* If there is NAT (network address translation) on the cluster.  This is pretty common.  Typically this would be that the head node has multiple network interfaces, one for the outside world and one for talking to the compute nodes.  In this case, you will need to use ifconfig to hunt down the right ip address.  Then you will need to use the --engine-ip flag to ipcontroller to set the ip address that the engines will connect to.  The engines get this from the furl file that the controller writes.<br>
<br>I am betting that the 2nd or 3rd of these is going on.  Keep us posted as these things can be pretty tough to debug because of how some clusters are setup.  But, take heart, I have never encountered a system that we could get working - and this includes some pretty crazy systems.<br>
<br>Cheers,<br><br>Brian<br><br><br><div class="gmail_quote">On Wed, Aug 12, 2009 at 12:15 AM, Matthieu Brucher <span dir="ltr">&lt;<a href="mailto:matthieu.brucher@gmail.com">matthieu.brucher@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">2009/8/11 Matthieu Brucher &lt;<a href="mailto:matthieu.brucher@gmail.com">matthieu.brucher@gmail.com</a>&gt;:<br>

<div class="im">&gt;&gt;&gt; 4.  Possibly add logic for copying the furl files around or for setting the<br>
&gt;&gt;&gt; command line options to point to them is they are on different locations.<br>
&gt;&gt;<br>
&gt;&gt; This may be the only thing that I couldn&#39;t check.<br>
&gt;<br>
&gt; OK, I only have an issue with this at the moment. This is a log from the engine:<br>
&gt;<br>
&gt; 2009-08-11 14:04:44+0200 [-] Log opened.<br>
&gt; 2009-08-11 14:04:44+0200 [-] Using furl file:<br>
&gt; /users/brucher/.ipython/security/ipcontroller-engine.furl<br>
&gt; 2009-08-11 14:04:44+0200 [Uninitialized] &#39;EngineConnector: engine<br>
&gt; registration failed:&#39;<br>
&gt; 2009-08-11 14:04:44+0200 [Uninitialized] Unhandled Error<br>
&gt;        Traceback (most recent call last):<br>
&gt;        Failure: twisted.internet.error.ConnectionRefusedError: Connection<br>
&gt; was refused by other side: 111: Connection refused.<br>
&gt;<br>
&gt; 2009-08-11 14:04:44+0200 [Uninitialized] error connecting to<br>
&gt; controller: Connection was refused by other side: 111: Connection<br>
&gt; refused.<br>
&gt; 2009-08-11 14:04:44+0200 [-] Main loop terminated.<br>
&gt;<br>
&gt; It is launch correctly by LSF, it is thus only a matter of setting the<br>
&gt; connection correctly.<br>
&gt;<br>
&gt; Matthieu<br>
<br>
</div>Is there a simple way to test the connections with foolscape?<br>
<div class="im"><br>
Matthieu<br>
--<br>
Information System Engineer, Ph.D.<br>
Website: <a href="http://matthieu-brucher.developpez.com/" target="_blank">http://matthieu-brucher.developpez.com/</a><br>
Blogs: <a href="http://matt.eifelle.com" target="_blank">http://matt.eifelle.com</a> and <a href="http://blog.developpez.com/?blog=92" target="_blank">http://blog.developpez.com/?blog=92</a><br>
LinkedIn: <a href="http://www.linkedin.com/in/matthieubrucher" target="_blank">http://www.linkedin.com/in/matthieubrucher</a><br>
</div><div><div></div><div class="h5">_______________________________________________<br>
IPython-dev mailing list<br>
<a href="mailto:IPython-dev@scipy.org">IPython-dev@scipy.org</a><br>
<a href="http://mail.scipy.org/mailman/listinfo/ipython-dev" target="_blank">http://mail.scipy.org/mailman/listinfo/ipython-dev</a><br>
</div></div></blockquote></div><br>