net: Do not take net_rwsem in __rtnl_link_unregister()
authorKirill Tkhai <ktkhai@virtuozzo.com>
Fri, 30 Mar 2018 16:38:37 +0000 (19:38 +0300)
committerDavid S. Miller <davem@davemloft.net>
Sun, 1 Apr 2018 02:24:58 +0000 (22:24 -0400)
This function calls call_netdevice_notifier(), which also
may take net_rwsem. So, we can't use net_rwsem here.

This patch makes callers of this functions take pernet_ops_rwsem,
like register_netdevice_notifier() does. This will protect
the modifications of net_namespace_list, and allows notifiers
to take it (they won't have to care about context).

Since __rtnl_link_unregister() is used on module load
and unload (which are not frequent operations), this looks
for me better, than make all call_netdevice_notifier()
always executing in "protected net_namespace_list" context.

Also, this fixes the problem we had a deal in 328fbe747ad4
"Close race between {un, }register_netdevice_notifier and ...",
and guarantees __rtnl_link_unregister() does not skip
exitting net.

Signed-off-by: Kirill Tkhai <ktkhai@virtuozzo.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
drivers/net/dummy.c
drivers/net/ifb.c
net/core/net_namespace.c
net/core/rtnetlink.c

index 30b1c85120490afb487f7d28e88f52ff9cf5860b..0d15a12a4560b37a4ed21d8e4bdd3bb853adb894 100644 (file)
@@ -219,6 +219,7 @@ static int __init dummy_init_module(void)
 {
        int i, err = 0;
 
+       down_write(&pernet_ops_rwsem);
        rtnl_lock();
        err = __rtnl_link_register(&dummy_link_ops);
        if (err < 0)
@@ -233,6 +234,7 @@ static int __init dummy_init_module(void)
 
 out:
        rtnl_unlock();
+       up_write(&pernet_ops_rwsem);
 
        return err;
 }
index 0008da7e9d4cc5f3d716803dd8855bd1a341f516..5f2897ec0edc516fcd846d0384f71888641d9b05 100644 (file)
@@ -330,6 +330,7 @@ static int __init ifb_init_module(void)
 {
        int i, err;
 
+       down_write(&pernet_ops_rwsem);
        rtnl_lock();
        err = __rtnl_link_register(&ifb_link_ops);
        if (err < 0)
@@ -344,6 +345,7 @@ static int __init ifb_init_module(void)
 
 out:
        rtnl_unlock();
+       up_write(&pernet_ops_rwsem);
 
        return err;
 }
index 7fdf321d4997d1da2541cccbe158a74daeafd7f3..a11e03f920d3a7d9d50a37f699ffd66a26a8a057 100644 (file)
@@ -51,6 +51,7 @@ static bool init_net_initialized;
  * outside.
  */
 DECLARE_RWSEM(pernet_ops_rwsem);
+EXPORT_SYMBOL_GPL(pernet_ops_rwsem);
 
 #define MIN_PERNET_OPS_ID      \
        ((sizeof(struct net_generic) + sizeof(void *) - 1) / sizeof(void *))
index e86b28482ca71d192e62bde5deb1f8ba41a14a3a..45936922d7e231acaad4dc06ebf445b5c1149b20 100644 (file)
@@ -412,17 +412,17 @@ static void __rtnl_kill_links(struct net *net, struct rtnl_link_ops *ops)
  * __rtnl_link_unregister - Unregister rtnl_link_ops from rtnetlink.
  * @ops: struct rtnl_link_ops * to unregister
  *
- * The caller must hold the rtnl_mutex.
+ * The caller must hold the rtnl_mutex and guarantee net_namespace_list
+ * integrity (hold pernet_ops_rwsem for writing to close the race
+ * with setup_net() and cleanup_net()).
  */
 void __rtnl_link_unregister(struct rtnl_link_ops *ops)
 {
        struct net *net;
 
-       down_read(&net_rwsem);
        for_each_net(net) {
                __rtnl_kill_links(net, ops);
        }
-       up_read(&net_rwsem);
        list_del(&ops->list);
 }
 EXPORT_SYMBOL_GPL(__rtnl_link_unregister);